티스토리 뷰
텍스트 분석의 접근 방법
1) 요소 단위에 따른 접근
- 텍스트 분석의 요소단위에 따른 접근
문자 수준, 단어 수준, 구 수준, 문장 수준, 초록 수준, 전문 수준, 전체 문헌집단 수준까지 광범위함
2) 기법적인 측면의 접근
- 텍스트 분석에 어떤 기법이 적용되는지에 대한 접근
수작업 태깅에서부터 추론학습까지 여러 가지 텍스트 분석 기법이 존재.
3) 임무 수행 측면의 접근
- 어떤 임무를 수행하느냐에 따르는 접근
정보검색에서부터 비지도 기반, 반지도 기반, 지도 기반의 기계학습, 시각화, 요약, 번역에 이르기까지 다양함
3가지 주요 접근 방법
1) 기술적 분석
- 데이터를 이해
- 대부분의 미가공 데이터는 사람들이 쓰기에 적합하지 않지만 데이터에서 끌어낸 정보는 적합함
- 대량의 데이터를 더 작고 유용한 정보의 알맹이로 압축할 수 있음
- 일어난 일을 요약함
- 비즈니스 분석의 80% 이상은 (태부분 특히 소셜 분석) 기술적임
ex) 포스트, 멘션, 팬들, 팔로워들, 페이지 뷰 횟수, 체크인 횟수 등이 있음
- 우리는 수 많은 데이터를 가지고 있다. 그것으로 무엇을 할 수 있는가?
2) 예측적 분석
- 모든 예측 분석은 현실적으로 개연성 있기 때문에 미래에 일어날 만한 것을 예측
- 과거와 최근의 데이터를 연구하기 위해 여러 통계, 모델링, 데이터 마이닝, 머신러닝 기법들을 이용
ex) 감성분석 - 현재 가지고 있지 않은 sentiment label의 데이터의 sentiment가 긍정인지 부정인지 예측
- 뇌 종양을 일으키는 새로운 유전자들은 무엇인가?
- 새로운 기술 트렌드 중에서 A회사가 투자해야 하는 것은?
3) 지시적 분석
- 기술적, 예측적 모델을 넘어 한가지, 혹은 그 이상의 행동들을 추천하며 각 결정의 예상 결과를 보여줌.
- 행동을 지시해야 하는 상황에 적합하며, 비지니스 결정자가 지시된 정보를 채택하여 실행에 옮길 수 있음.
-지시적 모델이 각각의 행동 선택에 따라 일어날 수 있는 결과를 예측할 수 있기 때문에 사전에 명시된 결과에 대한 가장 좋은 행동을 추천해줌.
'beginner > TextMining' 카테고리의 다른 글
Rasa: Open Source Language Understanding and Dialogue Management (0) | 2019.06.11 |
---|