김승욱님 강의 R studio 여러가지 설정하는 방법 Tools 탭 > Global Options를 클릭하면 다음과 같은 화면이 뜬다. Appearance에서 fontsize 14~16정도의 글자크기 적당 Editor Theme를 이용하여 R studio 테마를 바꿀 수 있다. 위 옵션에서 Code>Display에 들어가면 Highlight selected line, show whitespace characters, show indent guides 같은 것을 선택하면 코드 읽는 것의 가독성을 올릴 수 있다. 1. Highlight selected line은 다음과 같이 현재 선택된 코드 줄이 음영처리 된다. 2. show whitespace characters는 다음과 같이 코드 끝에 기호를 적어 코드..
출처 : 파이썬으로 데이터 주무르기 by 민형기 1단원 서울시 구별 CCTV현황 분석¶ CCTV 현황과 인구 현황 데이터 구하기 파이썬에서 텍스트 파일과 엑셀 파일을 읽기 -pandas pandas 기초 익히기 pandas를 이용해서 CCTV와 인구 현황 데이터 파악하기 pandas 고급기능 - 두 DataFrame 병합하기 CCTV 데이터와 인구 현황 데이터를 합치고 분석하기 파이썬의 대표 시각화 도구 - Matplotlib CCTV 현황 그래프로 분석하기 지난시간 정리 1. ~ 3.(https://jfun.tistory.com/210) 4. ~ 5.(https://jfun.tistory.com/211) 오늘은 1단원을 마쳐보도록 하겠다.¶ 1-6 CCTV 데이터와 인구 현황 데이터를 합치고 분석하기¶..
출처 : 파이썬으로 데이터 주무르기 by 민형기 1단원 서울시 구별 CCTV현황 분석¶ CCTV 현황과 인구 현황 데이터 구하기 파이썬에서 텍스트 파일과 엑셀 파일을 읽기 -pandas pandas 기초 익히기 pandas를 이용해서 CCTV와 인구 현황 데이터 파악하기 pandas 고급기능 - 두 DataFrame 병합하기 CCTV 데이터와 인구 현황 데이터를 합치고 분석하기 파이썬의 대표 시각화 도구 - Matplotlib CCTV 현황 그래프로 분석하기 지난번에 1-3 pandas 기초 익히기까지(https://jfun.tistory.com/210) 다루었다. 지난번에 이어 오늘은 1-4 pandas를 이용해서 CCTV와 인구 현황 데이터 파악하기 부터 시작하겠다. 1-4 pandas 이용해서 CC..
파이썬으로 데이터 주무르기라는 책을 보고 데이터 분석과정을 따라해보고자 한다. 이 책은 이 분야로 이끌어준 친한 동생이 추천해준 소중한 책이다. 처음에는 이해가 안되어 몇 개 따라해보다 말았는데, 이제는 이해 할 수 있을 정도가 되어 하나하나 따라해보며 과정을 곱씹어보려 한다. 이 책은 총 8개의 대단원으로 이루어져 있고, 각 대단원마다는 조금씩 관련이 있는것 같다. 지금 진행하는 단원은 다음과 같이 구성되어 있고, 시간날때마다 천천히 정리해보겠다. 1단원 서울시 구별 CCTV현황 분석¶ CCTV 현황과 인구 현황 데이터 구하기 파이썬에서 텍스트 파일과 엑셀 파일을 읽기 -pandas pandas 기초 익히기 pandas를 이용해서 CCTV와 인구 현황 데이터 파악하기 pandas 고급기능 - 두 Dat..
승욱선생님의 R강의 [R을 R려줘] R 문법 기초 - 인프런 데이터 분석을 시작하기 위해서 선택하는 필수 언어 중 하나인 R을 배우는 과정 입니다. 프로그래밍 언어를 처음 배우는 사람도 충분히 따라할 수 있을 정도로 쉽게 제작되어 있으니 부담없이 따라할 수 있습니다. 입문 프로그래밍 언어 R 온라인 강의 www.inflearn.com R이란? 통계학자들이 디자인하고 통계학자들을 위해 만들어진 언어/소프트웨어 오픈소스 프로젝트로서 무료이고 용량이 가볍다. 활용분야 DB라 불리우는 여러 파일 확장자(XLS, HTML, JPG, GIF, MOV, MP3)를 읽어들일 수 있다. 그리고 spss나 sas같은 통계프로그램도 가져올 수 있다. wearable기기라던지, sns 트위터라던지, 네이버 웹페이지 데이터를 ..
라사 논문 저장용 Abstract 대화형 소프트웨어를 구축하기 위한 오픈 소스 Python 라이브러리인 Rasa NLU와 Rasa Core라는 툴 한 쌍을 소개한다. 그들의 목적은 비전문 소프트웨어 개발자들이 머신러닝 기반의 대화 관리와 언어 이해에 접근할 수 있도록 하는 것이다. 설계 철학의 관점에서, 우리는 사용 편의성과 최소(또는 아니오)의 초기 훈련 데이터로부터의 부트스트래핑을 목표로 한다. 두 패키지는 광범위하게 문서화되어 있으며 종합적인 테스트 제품군과 함께 배송된다. 이 코드는 https://github.com/RasaHQ/에서 이용할 수 있다. 1 Introduction 우리가 자동화를 일상생활에 통합할 수 있는 좀 더 자연스러운 방법을 모색함에 따라 대화 시스템은 인간의 컴퓨터 상호작용의..
강의 : Stanford CS230: Deep Learning | Autumn 2018 | Lecture 10 - Chatbots / Closing Remarks 전에 들었던 강의들에서 들어서 알고 있는 내용이었지만 공부한다는 생각으로 내용을 정리해보고자 한다. 이 강의는 챗봇에 대해 설명하기 위해 학생들이 원하는 강좌를 찾거나 등록할 수 있는 챗봇을 예제로 설명하고 있다. 우리가 알고 있는 알고리즘이 어떻게 적용되는지 진행 과정을 통해 이해하는 수업이었다. Example1 Student: Hi! I want to enroll in CS106A for Winter 2019 to learn coding. Chatbot: For sure, I just enrolled you! Example2 Student:..
텍스트 분석의 접근 방법 1) 요소 단위에 따른 접근 - 텍스트 분석의 요소단위에 따른 접근 문자 수준, 단어 수준, 구 수준, 문장 수준, 초록 수준, 전문 수준, 전체 문헌집단 수준까지 광범위함 2) 기법적인 측면의 접근 - 텍스트 분석에 어떤 기법이 적용되는지에 대한 접근 수작업 태깅에서부터 추론학습까지 여러 가지 텍스트 분석 기법이 존재. 3) 임무 수행 측면의 접근 - 어떤 임무를 수행하느냐에 따르는 접근 정보검색에서부터 비지도 기반, 반지도 기반, 지도 기반의 기계학습, 시각화, 요약, 번역에 이르기까지 다양함 3가지 주요 접근 방법 1) 기술적 분석 - 데이터를 이해 - 대부분의 미가공 데이터는 사람들이 쓰기에 적합하지 않지만 데이터에서 끌어낸 정보는 적합함 - 대량의 데이터를 더 작고 유용..