티스토리 뷰

텍스트 분석의 접근 방법

 

1) 요소 단위에 따른 접근

- 텍스트 분석의 요소단위에 따른 접근

문자 수준, 단어 수준, 구 수준, 문장 수준, 초록 수준, 전문 수준, 전체 문헌집단 수준까지 광범위함

 

2) 기법적인 측면의 접근

- 텍스트 분석에 어떤 기법이 적용되는지에 대한 접근

수작업 태깅에서부터 추론학습까지 여러 가지 텍스트 분석 기법이 존재.

 

3) 임무 수행 측면의 접근

- 어떤 임무를 수행하느냐에 따르는 접근

정보검색에서부터 비지도 기반, 반지도 기반, 지도 기반의 기계학습, 시각화, 요약, 번역에 이르기까지 다양함

 

 

3가지 주요 접근 방법

 

1) 기술적 분석

- 데이터를 이해

- 대부분의 미가공 데이터는 사람들이 쓰기에 적합하지 않지만 데이터에서 끌어낸 정보는 적합함

- 대량의 데이터를 더 작고 유용한 정보의 알맹이로 압축할 수 있음

- 일어난 일을 요약함

- 비즈니스 분석의 80% 이상은 (태부분 특히 소셜 분석) 기술적임

ex) 포스트, 멘션, 팬들, 팔로워들, 페이지 뷰 횟수, 체크인 횟수 등이 있음

- 우리는 수 많은 데이터를 가지고 있다. 그것으로 무엇을 할 수 있는가?

 

2) 예측적 분석

- 모든 예측 분석은 현실적으로 개연성 있기 때문에 미래에 일어날 만한 것을 예측

- 과거와 최근의 데이터를 연구하기 위해 여러 통계, 모델링, 데이터 마이닝, 머신러닝 기법들을 이용

ex) 감성분석 - 현재 가지고 있지 않은 sentiment label의 데이터의 sentiment가 긍정인지 부정인지 예측

- 뇌 종양을 일으키는 새로운 유전자들은 무엇인가?

- 새로운 기술 트렌드 중에서 A회사가 투자해야 하는 것은?

 

3) 지시적 분석

- 기술적, 예측적 모델을 넘어 한가지, 혹은 그 이상의 행동들을 추천하며 각 결정의 예상 결과를 보여줌.

- 행동을 지시해야 하는 상황에 적합하며, 비지니스 결정자가 지시된 정보를 채택하여 실행에 옮길 수 있음.

-지시적 모델이 각각의 행동 선택에 따라 일어날 수 있는 결과를 예측할 수 있기 때문에 사전에 명시된 결과에 대한 가장 좋은 행동을 추천해줌.

 

 

 

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함