라사 논문 저장용 Abstract 대화형 소프트웨어를 구축하기 위한 오픈 소스 Python 라이브러리인 Rasa NLU와 Rasa Core라는 툴 한 쌍을 소개한다. 그들의 목적은 비전문 소프트웨어 개발자들이 머신러닝 기반의 대화 관리와 언어 이해에 접근할 수 있도록 하는 것이다. 설계 철학의 관점에서, 우리는 사용 편의성과 최소(또는 아니오)의 초기 훈련 데이터로부터의 부트스트래핑을 목표로 한다. 두 패키지는 광범위하게 문서화되어 있으며 종합적인 테스트 제품군과 함께 배송된다. 이 코드는 https://github.com/RasaHQ/에서 이용할 수 있다. 1 Introduction 우리가 자동화를 일상생활에 통합할 수 있는 좀 더 자연스러운 방법을 모색함에 따라 대화 시스템은 인간의 컴퓨터 상호작용의..
텍스트 분석의 접근 방법 1) 요소 단위에 따른 접근 - 텍스트 분석의 요소단위에 따른 접근 문자 수준, 단어 수준, 구 수준, 문장 수준, 초록 수준, 전문 수준, 전체 문헌집단 수준까지 광범위함 2) 기법적인 측면의 접근 - 텍스트 분석에 어떤 기법이 적용되는지에 대한 접근 수작업 태깅에서부터 추론학습까지 여러 가지 텍스트 분석 기법이 존재. 3) 임무 수행 측면의 접근 - 어떤 임무를 수행하느냐에 따르는 접근 정보검색에서부터 비지도 기반, 반지도 기반, 지도 기반의 기계학습, 시각화, 요약, 번역에 이르기까지 다양함 3가지 주요 접근 방법 1) 기술적 분석 - 데이터를 이해 - 대부분의 미가공 데이터는 사람들이 쓰기에 적합하지 않지만 데이터에서 끌어낸 정보는 적합함 - 대량의 데이터를 더 작고 유용..