티스토리 뷰

Fraudit을 블로깅 해보려고 한다.


부정적발, 분식회계탐지 등을 위한 회계 감사를 위해 만들어진 툴으로 Python 베이스 소프트웨어이다.


KICPA에서 Instructor로 계신 회계사님의 스터디(?)에 우연히 참가할 기회를 얻어 배워보게 되었는데, 회계 데이터 분석을 하는데 상당히 강력한 툴인것 같은데 잘 사용하면 내가 데이터 분석을 하는데 도움을 받을수 있을것 같아서 사용해 보려고 한다.


내가 이 툴에 대한 설명을 들으며 가장 마음에 들었던 것은, 아주 큰 자료도 여기서는 보다 빠르게 열 수 있다고 한다. 최대 21억개 가량의 열(row)을 열 수 있다고 한다. 그리고 그 자료들이 테이블 형식으로 열린다는 점! 엑셀은 큰 데이터가 열리지 않고, 파이썬 같은경우는 열더라도 일부만 보여주고 나머지는 '...' 처리가 되기때문에 답답할때가 있는데, 그 답답한 부분을 해소할 수 있을것 같다.




짧은 시간에 압축되어 들었더니 해주시는 말씀을 전부 이해하진 못했지만, 최대한 되새김질하여 올려본다.


자세한 내용은 '부정적발을 위한 전산감사기법' 이라는 책을 구매하여 보길 바란다.




http://www.fraudit.io/main.do 에서 다운로드 후 가입을 하면 14일 평가판 사용이 가능하다.


실행시키면 폴더를 선택하라고 하는데 그 선택한 폴더에 proudit이 설치된다.


나중에 폴더를 바꿔주고 싶다면 File 탭의 Set Project Folder에서 설정해줄 수 있다.



밑의 사진에 빨간 네모를 네군데 쳐 놨는데 각각 Menubar, Object Tree, Table/Script tabs, Shell이라 부른다. 


테이블 탭은 table 자료가 열리는 공간을 말하고, shell은 >>>을 봐서 알겠지만 코드와 관련되어 있는 부분인데, 우리가 작업하고 있는 것들을 코드로 보여주기도 하고, 저 부분에 코드를 직접 쳐서 작업을 수행할수도 있다.

Numpy와 pandas가 디폴트 값 이므로 따로 불러올 필요가 없다.

History는 이름처럼 지금까지 작업한 내용이 저장되어 있고 삭제되지 않는다. 



Object Tree에서 samples를 눌러서 보면 예제파일이 있는데 이름을 보면 tbl 형식으로 되어있음을 볼 수 있다. tbl 형식이란 table을 의미한다.



우선 오브젝트 트리에서 sample의 Bid.tbl을 열어보자.


그러면 테이블 탭에 열리게 되면서 shell에 Bid.tbl 파일이 열렸음을 코드로 보여준다.




1. Stratify by value


Stratify는 특정 칼럼의 값이 여러개로 구성될 때 이를 그룹핑하여 보여주는 기능이다.


Data - Stratify - Value를 눌러보자.

그러면 다음과 같은 창이 뜨는데, 우선 입찰 일자를 클릭한 후 table 이름을 지정하여 OK를 눌러보자.


그러면 다음과 같이 2009-01-09 00:00:00 시간의 자료가 보이게 되는데, 이건 사라진게 아니다. 아까 입찰 일자에 대해서 그룹핑 시켰기 때문에 2009-01-09 00:00:00 사간의 자료는 한개 뿐이라서 한개만 보인것이다. 오른쪽 위의 of  옆에 있는 화살표를 클릭해보면 그룹들을 순서대로 보여준다.


> 만약 두 개 이상의 컬럼을 선택하여 stratify를 한다면 그 칼럼들을 동시에 만족하는 기준으로 그룹핑 한다.

> 테이블을 삭제하려면 테이블 텝 윗쪽의 테이블 이름 옆에 x를 클릭하면 된다. 

date 테이블과 Bid 테이블을 삭제해보자.



2. Summerize by Value


이 것은 어떤 컬럼의 값을 단수 혹은 복수 필드에 대해 요약 할 수 있는 기능이다.


sample의 분개장.tbl을 열자. 분개장 샘플이다.


Data - Summerize - Value를 눌러보자.


이 기능을 사용하여 계정코드에 대해서 차변과 대변의 합을 구해보자.

태이블 선택후 계정코드 > sum > 차변(대변)금액> Add> 차변(대변)합계


그 다음 result table에 원하는 테이블 명을 적고 ok를 누르자.

계정코드별로 차변합계와 대변합계를 비교할 수 있다.


회계에서는 Stratify와 Summerize 기능을 가장 많이 사용한다고 한다.



3. 테이블 수정


메뉴텝에 보면 공구 모양의 버튼이 있는데, 이게 테이블 수정 도구이다.

버튼을 눌러보면 다음과 같은 창이 뜬다.


table properties의 왼쪽 버튼을 누르면 필드를 추가하거나 삭제, 순서변경을 할 수 있다.


그리고 오른쪽에서는 Type을 이용해 string(글씨), Integer(숫자), 날짜 등 글자 타입을 정할수 있다. 

숫자의 경우 타입이 string인지 integer인지 헷갈릴 때는 테이블에서 봤을 때 앞으로 정렬되어 있다면 string, 뒤로 정렬되어 있다면 integer라고 보면 된다. 

그리고 format에 글짜 타입의 형태(?)를 결정할 수 있다.  #,###와 같이 쓰게 되면 1000의 자리 숫자를 쓸 때 자동으로 숫자 셋째자리 앞에 ','(콤마)가 찍히게 된다.

Active Calculation은 매번 properties에 들어올 필요없이 알아서 계산 해주는 기능인데, 회계사님께서 이 것을 습관처럼 사용하는 것은 좋지 않다고 하셨다.


그리고 calculation 칸을 눌러보면 다음과 같이 나오는데, 여러가지 계산을 이용해 그 컬럼을 나타내줄 수 있다.



OK OK를 누르면 다음과 같은 결과를 얻게 된다.



스크립트 작업을 이용하여 테이블 작업을 할 수 있다. (파이썬 언어, for문을 이용해 반복작업 용이)

Shell에 적힌 코드를 복사해서 스크립트에 넣어서 사용할 수도 있다. 

(차변대변차이라는 필드를 삭제 후 스크립트를 실행시켜 보았더니 그대로 다시 생겼다.)


Note. 


다음과 같이 table명.todf를 치면 그 테이블이 데이터 프레임으로 바뀐다.







공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함