Fraudit - Select, merge, Analyze 기본 기능

티스토리 뷰

beginner/전산감사기법 Fraudit

Fraudit - Select, merge, Analyze 기본 기능

johh 2019. 3. 9. 01:38

1. filter

조건문을 이용하여 내가 원하는 정보를 찾아오는 기능이다.

sample에서 test 테이블을 불러오자.

테이블 탭을 보면 윗쪽에 Filter Expression이라는 글자와 검색창이 보일 것이다.

여기에 조건문을 집어 넣고 set을 누르면 해당하는 열(row)들만 보여준다. set을 누르면 버튼 이름이 release로 바뀐다. 이때 release를 누르면 조건문을 적용하기 전 상태로 돌아간다.

필터링을 하는 또 다른 방법이 있는데, shell또는 스크립트에 직접 코드를 작성하고 실행하는 것이다.

주의사항. 필터기능은 원본이 변형될 경우 영향을 받으니, 정보가 필요할 경우 저장해 놓기.

2. Select by Extra Match

Data - Select -by Extra Match

위에서 배운 필터 기능보다 더 섬세하게 조작할 수 있다.

여러가지 조건문을 손쉽게 추가할 수 있고, 필터링의 결과로 나오는 열(row)에서 원하는 필드값만 가져 올 수 있다.

그리고 필터에서의 주의사항을 여기서는 고려하지 않아도 된다!

필터링 한 결과값이 새로운 테이블로 열리기 때문에 원본값이 변하더라도 결과값은 영향을 받지 않는다.

물론, 이 방법도 shell이나 스크립트를 작성하여 실행 시킬수 있다.

>>> test_selected = Simple.select(test, 'record.A == 2')

3. 합산기능

열을 드래그 하면, 드래그 한 열(row)의 개수와 숫자의 합을 표시한다.

이 기능은 열(row)의 개수가 적을 때는 유효하지만, 개수가 몇백만개 몇천만개 될 때는 직접 코드(sum)를 사용하여 계산하는게 좋다.

4. Select by Record Index

Data - Select -by Record Index

데이터에서 가지고 오고싶은 일부 열(row)만 새로운 테이블로 만들 수 있다.

Include These Row(Range)를 이용하면 연속된 열(row)을 가져올 수 있고,

Row indices 기능을 이용하면 콤마를 이용하여 연속되지 않은 열을 가져올 수 있다.

두 기능이 동시에 되지는 않는다.

5. Select by wildcard pattern

Data - Select -by Record Index

어떤 text나 숫자 특수문자를 포함하는 열(row)을 찾을 수 있다.

또는 포함하는 열(row)만 제외시킬 수 있다.

설명에 나와있는 예제와 같이 찾거나 제외하는 방법도 있다.

Match text에 pattern 값을 넣으면, Match result에서 결과값 sample을 출력해서 보여준다.

6. Select by Regular Expression Pattern

Data - Select -by Regular Expression Pattern

파이썬 정규식을 사용한다는 점을 제외하고는 select by wildcard pattern과 메뉴 사용 방법이 유사하다고 한다.

어떤 차이가 있는지는 나도 모르겠다.

7. merge

data - merge

테이블과 테이블을 밑으로 단순 연결 한다.

단 테이블의 데이터간에 필드 개수가 같아야 한다.

8. Pivot Table

엑셀과 기능이 동일.

엑셀은 그룸핑이 잘 되고, 속도는 이게 더 빠름.

9. 데이터 불러오기

개인적으로 가장 마음에 들었던 기능.

File - import - Text File or Excel Spreadsheet

select를 이용해 불러올 텍스트나 CSV, Excel 파일을 선택한다.

위에서 불러온 파일 종류에 따라 선택해주면 된다.

Delimiter : 테이블 표현을 뭘로 할 것인지, 콤마가 편한 것 같다.

First row contain field names : 클릭하면 0 열에 필드명이 포함된다.

필드명이나 자료형을 수정하는 단계

파이썬에서는 모든 데이터를 눈으로 확인할 수 없는데 너무 좋다.

데이터 불러오는 속도도 정말 빠르다. (3.7로 업그레이드 하면 더 빠르다고 한다.)

Note. 이것보다 훨씬 더 빠르게 불러오는 방법이 있는데, shell이나 스크립트에서 코딩을 하는 것이다.

>>> test.pd.read_csv()

이런식으로 판다스로 불러온 후, 테이블이름 = Table(data=dataframe이름)을 이용하여 테이블로 바꿔준다.

10. 다른 데이터베이스와 연결

file - New Database Connection

11. 사실 가장 먼저 해야 하는 것

sample에서 분개장.tbl을 연다.

Analize - Descriptives

통계분석을 해주는 기능이므로 차변과 대변의 토탈값을 바로 비교해볼 수 있다.

다르면 다른 회계 데이터 분석 의미없다. 빠꾸~

12. Benford 분석

어떤 그래프 특징을 가져야만 하는데, 특정 값이 예상 그래프와는 다르게 툭 튀어 나오면 문제가 있다라고 판단.

부정적발 분식회계에 이용

Analyze - Benford Analyze

서울시 깃허브에서 2018 업무추진비를 분석해보면 독특한 특징을 볼 수 있다.

13. Digital 분석

Analyze - Digital Analyze

어떤 계정과목의 빈도 파악

14. 중복값 찾기

Analyze - Find - Duplicate

15. 비어있는 값 찾기

Analyze - Find - gaps

설명 까먹음. 물어보기.

앱리스크의 몬테카를로 시뮬레이션 알아보기.

'beginner > 전산감사기법 Fraudit' 카테고리의 다른 글

Fraudit - Join, Chart 기본 기능 (0)	2019.03.08
Fraudit 시작! (0)	2019.03.08

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

글 보관함

조환희의 학습 블로그

티스토리 뷰

Fraudit - Select, merge, Analyze 기본 기능

'beginner > 전산감사기법 Fraudit' 카테고리의 다른 글

티스토리툴바