프로그래밍 Programming
라즈베리파이4 cffi 에러 ERROR: Failed building wheel for cffi on Raspberry Pi Model 4
2020. 8. 27.아래와 같이 라즈베리 파이 4 에서 cffi 라이브러리 설치시 ERROR: Failed building wheel for cffi 가 발생하는 경우에는 다음과 같이 처리한다. ciffi 는 libffi 에 의존한다. 따라서 다음과 같이 먼저 libffi-dev 패키지를 설치해야 한다. 사용하고 있는 배포판에 따라 패키지는 다소 상이할 수 있다. (env) pi@raspberrypi:~/GC-IoT_Python_example/example $ sudo apt install libffi-dev 패키지 목록을 읽는 중입니다... 완료 의존성 트리를 만드는 중입니다 상태 정보를 읽는 중입니다... 완료 다음 패키지가 자동으로 설치되었지만 더 이상 필요하지 않습니다: rpi-eeprom-images Use 'su..
VNC를 통해서 라즈베리 파이로 파일 전송하기 Transferring files to and from your Raspberry Pi
2020. 8. 26.윈도우, 맥 또는 리눅스 데스크탑에서 VNC 뷰어를 통해 연결한 라즈베리 파이로부터 파일을 가져오는 방법에 대해 알아본다. 먼저 라즈베리 파이로 파일을 보내고자 하는 경우 스크린 상단 중앙에 위치한 VNC 뷰어의 툴바 버튼 중 아래와 같이 Transfer files 버튼을 클릭한다. 그리고 라즈베리 파이로부터 파일을 가져오고자 하는 경우에는 우측 상단의 VNC Server 아이콘을 클릭해서 진행한다. Send files 버튼을 눌러서 전송할 파일을 선택한다. 파일을 선택한 뒤 OK 버튼을 눌러 전송한다. 전송이 완료되었다. 윈도우 바탕화면에 정상적으로 다운로드된 것을 확인할 수 있다. 더욱 자세한 내용은 다음 링크를 참조한다. https://help.realvnc.com/hc/en-us/articles/..
라즈베리파이 Cannot Currently Show the Desktop' 에러 How to Fix Raspberry Pi's 'Cannot Currently Show the Desktop' Error
2020. 8. 26.VNC 를 사용하여 리모트로 라즈베리 파이에 접속할 때 다음과 같이 검정 스크린에 “Cannot currently show the desktop” 에러가 발생하는 경우가 있다. 스크린 해상도 변경 명령창에서 해상도를 변경함으로써 문제가 해결될 수도 있다. 먼저 raspi-config 를 로딩한다. pi@raspberrypi:~ $ sudo raspi-config 옵션중 7 Advanced Options → Resolution 선택한다. A5 Resolution 옵션을 선택하여, 해상도를 지정한다. 최소한 1280 x 720 이상을 선택한다. 여기서는 1920 x 1080 을 선택했다. 재부팅 후 VNC 로 접속해보면 다음과 같이 정상적으로 스크린이 뜨는 것을 확인할 수 있다. https://www.ras..
판다 데이터프레임 합치기 concat(), merge(), merge_asof() Joining DataFrames in Pandas
2020. 8. 8.대부분의 경우 데이터는 다수의 소스나 파일로부터 나오므로, 데이터프레임을 합치는 작업은 아주 중요한 작업 중 하나로, 여기서는 Pandas 라이브러리를 사용하여 복수의 데이터프레임을 병합하는 방법에 대해 살펴보자. Concatenate DataFrames 먼저 pandas 라이브러리를 임포트한다. import pandas as pd 파이썬 딕셔너리로 샘플로 사용할 데이터프레임을 다음과 같이 만든다. dummy_data1 = { 'id': ['1', '2', '3', '4', '5'], 'Feature1': ['A', 'C', 'E', 'G', 'I'], 'Feature2': ['B', 'D', 'F', 'H', 'J']} 딕셔너리 dummy_data1 의 키는 컬럼명이고 리스트의 값들은 각각의 행에 대응..
np.random.seed 란 무엇인가?
2020. 8. 8.np.random.seed(0) 은 난수를 예측가능하도록 만든다. 다음의 예를 보자. np.random.seed 를 사용하면 다음과 같이 동일한 셋트의 난수가 나타나게 된다. import numpy as np np.random.seed(0) ; np.random.rand(4) array([0.5488135 , 0.71518937, 0.60276338, 0.54488318]) np.random.seed(0) ; np.random.rand(4) array([0.5488135 , 0.71518937, 0.60276338, 0.54488318]) 하지만 random seed 가 리셋되지 않으면, 다음과 같이 매번 서로 다른 수가 나타나게 되는 것이다. np.random.rand(4) array([0.423654..
Numpy linspace 함수 살펴보기 numpy.linspace() in Python
2020. 8. 8.NumPy linspace 함수는 숫자로 된 시퀀스를 생성하는 툴로, NumPy arange 함수와 유사하지만, Numpy array 로 구성된 균등한 간격을 둔 시퀀스를 생성한다. 시작점과 종점을 정하고, 해당 간격내(시작점과 종점 포함)의 브레이크포인트의 총 갯수를 정하면, np.linspace 함수는 해당 간격내에 일정한 간격을 둔 브레이크포인트 갯수만큼의 시퀀스를 반환하게 된다. 간단하게 다음과 같은 경우를 생각해보자. import numpy as np np.linspace(start = 0, stop = 100, num = 5) array([ 0., 25., 50., 75., 100.]) 위 코드는 다음과 같은 Numpy Array (ndarray object) 를 생성한다. 해당 범위내에 nu..
아나콘다 환경 공유하기 Sharing an environment
2020. 7. 28.아나콘다 환경을 재빠르게 다시 구축하기 위해서는 포함된 패키지와 각각의 버전 정보가 필요하다. 아나콘다 환경 공유방법을 아래에서 알아보자. Exporting the environment.yml file 첫번째 방법은 현재의 환경 정보가 담긴 yml 파일을 생성하는 것이다. 다음과 같이 가능하다. 먼저 가상환경을 활성화시킨다. fossa@fossa:~$ conda activate quintic 현재의 가상환경 설정을 다음과 같이 quintic_environment.yml 파일로 내보낸다. (quintic) fossa@fossa:~$ conda env export > quintic_environment.yml 정상적으로 export 되었으면 다음과 같이 yml 파일이 생성된 것을 확인할 수 있다. 해당 위치..
우분투 20.04에 아나콘다 파이썬 배포만 설치하기 How To Install the Anaconda Python Distribution on Ubuntu 20.04
2020. 7. 8.본 포스팅에서는 Ubuntu 20.04 서버에 파이썬 3.0 버전의 아나콘다를 설치하는 과정을 소개한다. 우분투 20.04의 코드네임은 Focal Fossa 이다. Installing Anaconda 아나콘다를 설치하는 가장 좋은 방법은 최신 버전의 Anaconda installer bash script 를 다운로드받아 검증 후 실행하는 것이다. 최신 버전은 Anaconda Downloads page 에서 다운로드받을 수 있다. 현재 시점의 가장 최신 버전은 2020.02 이다. 다음으로 /tmp 디렉토리로 이동한다. fossa@fossa:~$ cd /tmp curl 명령을 이용해서 아나콘다 웹사이트에서 복사한 링크를 붙여 다운로드하자. 그리고 빠른 사용을 위해 anaconda.sh 라는 파일로 아웃풋을..
라즈베리파이4 라즈비안 설치 및 SSH 셋업
2020. 5. 4.디바이스마트에서 구매한 스타터키트가 도착했다. 스타터키트에 카메라 모듈만 추가로 구매했다. 구리 방열판을 다음과 같이 붙이고, 케이스도 끼워본다. 먼저 라즈비안을 microSD 카드에 설치해보자. 아래 링크에서 다운로드할 수 있다. 물론 라즈비안 외에 우분투 등의 설치옵션도 있지만, 기본적인 설치부터 해보자. Download Raspbian for Raspberry Pi Raspbian is the Foundation's official supported operating system. You can install it with NOOBS or download the image below. www.raspberrypi.org 몇 가지 다운로드 옵션이 있는데, 여기서 Raspbian Buster with ..
코세라 강의 Introduction to TensorFlow for Artificial Intelligence, Machine Learning, and Deep Learning 2주차 실습
2020. 4. 30.코세라 강의 Introduction to TensorFlow for Artificial Intelligence, Machine Learning, and Deep Learning > 2주차 > Week 2 Resources > Beyond Hello World, A Computer Vision Example 에 나오는 내용을 가지고 GCP 환경에서 주피터랩을 통해 실습을 진행해보았습니다. 먼저 텐서플로우를 임포트한다. import tensorflow as tf print(tf.__version__) 2.1.0 Fashion MNIST 데이터는 tf.keras 데이터셋 API 를 통해 바로 사용가능하다. 다음과 같이 로딩할 수 있다. mnist = tf.keras.datasets.fashion_mnist l..
파이썬 Speech Recognition 을 사용한 간단한 음성 텍스트 변환 Easy Speech-to-Text with Python
2020. 4. 20.은닉 마르코프 모형 (Hidden Markov Model, HMM), 심층학습모델을 통해 오디오 파일을 텍스트로 변환할 수 있다. 여기서는 “Speech Recognition” API 와 “PyAudio” 라이브러리를 통해 간단하게 구현하는 방법을 알아보자.Speech Recognition API는 다수의 API를 지원하는데, 여기서는 Google speech recognition API 를 사용하도록 한다. 더욱 자세한 내용은 여기를 참고한다. 먼저 필요한 라이브러리를 설치한다. 이하 아나콘다 가상환경에서 진행한다. 아나콘다에서의 Speech Recognition 라이브러리 설치는 https://anaconda.org/conda-forge/speechrecognition 을 참고한다. (tfquantu..
주피터랩 실행 오류 ModuleNotFoundError: No module named 'jupyter_nbextensions_configurator'
2020. 4. 16.다음과 같이 아나콘다 가상환경에서 주피터랩 설치 후 실행시 ModuleNotFoundError 가 발생하는 경우 (tfquantum) founder@hilbert:~$ conda install -c conda-forge jupyterlab Collecting package metadata (current_repodata.json): done Solving environment: done ## Package Plan ## environment location: /home/founder/anaconda3/envs/tfquantum added / updated specs: - jupyterlab (tfquantum) founder@hilbert:~$ jupyter lab --no-browser --ip=0.0..
우분투 18.04 에서 아나콘다와 주피터 노트북 설치하기 Anaconda and Jupyter Notebook Install Instructions - Ubuntu
2020. 4. 16.Ubuntu 18.04 에서 Continuum’s Anaconda 5.2.0 설치하기 Install Anaconda and Jupyter Notebook 다음과 같이 터미널에서 Downloads 디렉토리를 생성한 후 해당 디렉토리로 이동하여 Anaconda 5.2.0 을 다운로드한다. ~$ cd downloads ~/downloads$ wget https://repo.anaconda.com/archive/Anaconda3-2019.07-Linux-x86_64.sh --2020-03-27 06:27:42-- https://repo.anaconda.com/archive/Anaconda3-2019.07-Linux-x86_64.sh Resolving repo.anaconda.com (repo.anaconda.c..
Covid-19 데이터셋을 활용한 코로나 바이러스 현황 분석 Analysis on Coronavirus
2020. 4. 13.공개된 국내 코로나 바이러스(covid-19) 데이터를 이용하여, 주피터 노트북을 가지고 분석해보자. 먼저 예제 실행을 위해 주피터 노트북을 먼저 구동한다. (base) founder@hilbert:~$ source activate AnnaM (AnnaM) founder@hilbert:~$ cd annam (AnnaM) founder@hilbert:~/annam$ jupyter notebook --no-browser --ip=0.0.0.0 Libraries 예제 실행에 필요한 라이브러리를 가져온다. import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import matplotlib.dates..
아나콘다 가상환경에서 장고 임포트 에러 ImportError: Couldn't import Django
2020. 4. 4.아나콘다 가상환경을 활성화시킨 상황에서 다음과 같이 Django 설치 및 프로젝트를 시작하였다. (tfquantum) founder@hilbert:~$ pip install Django==3.0.5 Defaulting to user installation because normal site-packages is not writeable Collecting Django==3.0.5 Downloading Django-3.0.5-py3-none-any.whl (7.5 MB) |████████████████████████████████| 7.5 MB 2.7 MB/s Collecting sqlparse>=0.2.2 Downloading sqlparse-0.3.1-py2.py3-none-any.whl (40 kB)..
파이썬 - 문자열 (생성, 데이터 변환, 이스케이프 문자, 결합, 복제, 추출, 슬라이스, 길이, 나누기, 일반함수, 대소문자, 배치, 대체)
2020. 4. 2.문자열은 파이썬 시퀀스 타입의 하나이며, 불변immutable 이다. 문자열의 생성 단일인용부호 또는 이중인용부호로 생성할 수 있다. 2가지 인용부호가 존재하는 이유는 인용부호가 포함된 문자열을 만들기 위해서이다. >>> 'second' 'second' >>> "minute" 'minute' >>> 3개의 단일인용부호 혹은 3개의 이중인용부호는 여러 줄의 문자열에 사용한다. 3개의 단일인용부호 안에 여러 줄이 있는 경우, 문자열 끝에 들어 있는 라인 끝 문자는 보존된다. 그리고 양쪽 끝에 공백이 있는 경우에도 보존된다. >>> blake = '''In seed time learn, in harvest teach, in winter enjoy. ... Drive your cart and your plow ..
리눅스에서 cirq 설치하기 Installing cirq on Linux
2020. 3. 28.Cirq는 양자회로를 작성, 조작, 최적화하고 양자컴퓨터와 시뮬레이터에서 구동하는 소프트웨어 라이브러리이다. Cirq는 하드웨어 상세를 추상화시켜 사용하지 못하게하는 대신에 하드웨어 상세를 노출하고자 한다. 왜냐하면, Noisy Intermediate-Scale Quantum (NISQ) 체제에서는 이러한 하드웨어 상세가 회로를 구동시킬 것인지 말 것인지를 결정하기 때문이다. 이하 리눅스 환경에서의 cirq 설치에 대해 알아본다. 먼저 설치된 파이썬 버전이 3.6.0 이상인지 확인한다. 향후 텐서플로우 사용을 고려하면 3.7 버전이 적당하겠다. (tfquantum) founder@hilbert:~$ python --version Python 3.7.7 pip를 사용하여 cirq 를 설치한다. 먼저 pip..
아나콘다 파이썬 3.8 업그레이드 Upgrade to python 3.8 using conda
2020. 3. 28.Photo by Markus Spiske from Pexels 아나콘다 가상환경의 파이썬 버전을 3.8 로 업그레이드 해보자. 물론 현재 시점에서는 new anaconda individual edition 2020 distribution 이 나와있는 상태이긴 하지만, 기존 버전 사용자의 경우 다음과 같이 업그레이드를 진행할 수 있다. 먼저 가상환경 활성화하기 이전 base 상태에서, conda 업데이트를 진행한다. conda 업데이트 (base) founder@hilbert:~$ conda update -n base -c defaults conda Collecting package metadata: done Solving environment: done ## Package Plan ## environme..
윈도우즈10 Antimalware Service Executable 메모리 점유 과다 문제
2020. 3. 25.Antimalware Service Executable 프로세스가 메모리를 과다하게 점유하여 정상적인 앱실행이 어려운 경우 해결 방법입니다. Antimalware Service Executable (MsMpEng)은 Windows Defender 관련 파일입니다. 위의 스크린샷을 보면, 전체 메모리의 16.5% 를 차지 하고 있음을 알 수 있습니다. 전체 메모리 사용량은 99% 이구요. 상기 프로세스가 CPU 혹은 디스크 리소스를 과도하게 점유하는 증상이 나타나는 경우, 다음의 방법들을 차례대로 진행해보시기 바랍니다. [방법 1] ▶ 윈도우즈키 + Q 를 눌러 검색창에 작업 스케줄러라고 입력한다. 검색결과에서 작업 스케줄러를 선택 후 관리자 권한으로 실행을 선택한다. 해당 앱이 로딩되면, 작업스케줄 라이..
주피터노트북 디렉토리 이동 명령어 Built-in magic commands %cd
2020. 3. 15.%cd 를 이용하여 주피터 노트북에서 현재 디렉토리를 다른 경로로 변경할 수 있다. 위 명령어는 IPython 세션 동안 여러분이 방문 디렉토리를 내부적으로 보관하고 있게 된다. 그리고 %dhist 를 통해 디렉토리 방문이력을 확인할 수 있다. %dhist Directory history (kept in _dh) 0: /home/founder/annam/kaggle 1: /home/founder/annam 2: /home/founder 3: /home/founder/annam/kaggle 4: /home/founder/annam/kaggle/input 5: /home/founder/annam/kaggle 6: /home/founder/annam 7: /home/founder 8: /home/founder..
초보자를 위한 리눅스 tree 명령어 사용법 Linux ‘tree Command’ Usage Examples for Beginners
2020. 3. 15.Photo by Johannes Plenio from Pexels tree 는 디렉토리를 리스팅하거나 컨텐츠 내용을 볼 때 사용할 수 있는 간단한 명령어이다. 디렉토리 경로와 서브디렉토리내의 파일, 그리고 서브디렉토리와 파일의 전체 갯수 등을 보여준다. tree 프로그램은 리눅스, 도스, 윈도우즈 등 다양한 운영체제에서 사용가능하지만 여기서는 리눅스 환경에서의 활용에 대해 살펴본다. 본격적인 사용에 앞서 해당 라이브러리부터 설치해보자. (AnnaM) founder@hilbert:~/annam/kaggle$ sudo apt install tree Reading package lists... Done Building dependency tree Reading state information... Done T..
주피터 노트북 셀 실행결과 구글시트나 엑셀로 복사하기 How to copy/paste a dataframe from iPython into Google Sheets or Excel?
2020. 3. 15.Photo by bongkarn thanyakij from Pexels 주피터 노트북 사용시 셀 실행결과로 나온 테이블 등을 엑셀 등에 복사하고자하는 경우, 다음과 같이 테이블 형태로 들어가지 않는 경우 처리방법에 대해 알아보자. 주피터 노트북은 크롬 등의 브라우저에서 구동이 되므로, 셀을 복사하고 클립보드에 붙여넣는 자바스크립트를 만들 수 있다. 다음의 자바스크립트를 크롬 등의 북마크에 저장하고 노트북이 구동되는 페이지에서 실행하면 된다. 아래를 보자. javascript:(function%20()%20%7B%20function%20SelectText(element)%20%7B%20var%20range%3B%20var%20selection%3B%20if%20(document.body.createText..
신경망의 기본 구조
2020. 3. 5.유닛의 특징 유닛은 단순하게 추상화한 뉴런이다. 유닛은 연산기능이 있으므로, 출력이 다수라도 출력값은 0 또는 1 이다. 유닛은 가중치를 포함한 입력으로 정리된다 Z=W1X1+W2X2+...+WnXn+B (W1, W2, ..., Wn 은 가중치, B는 편향, n은 입력수) 유닛은 가중치를 포함하는 입력 z 를 매개변수로 사용하는 활성화함수(전달함수)이며 y 를 출력한다. y=a(z) 활성화함수 - 사용자가 정의 출력값 y - 활성화함수를 사용할 수 있는 임의의 수 출력신호해석 - 유닛의 흥분도, 반응도, 활성도 신경망의 기본구조 층을 겹겹이 쌓은 신경망. 층을 쌓는 방법에 따라 다양한 방법이 있음 필기체 숫자 식별 신경망의 특징은 입력층의 유닛 전부가 중간층의 유닛 전부에(완전연결계층 fully conn..
Dash and Plotly 를 활용한 인터랙티브 시각화 Interactive Visualization with Dash and Plotly
2020. 3. 4.인터랙티브 데이터 시각화는 실험 데이터 분석에 중요한 역할을 한다. 데이터셋에 기술적 또는 예측적 알고리즘을 적용하기에 앞서, 특성간 연관성이 어떤지 그리고 내부적으로 어떻게 분포되어 있는지 파악하는 것이 중요하다. 이를 위해 수많은 시각화 라이브러리가 수많은 형태의 차트를 제공하고 있지만, 분명한 점은 각각의 속성에 대해 매번 차트 작업을 하고, 해당 챠트를 다른 특성과 매번 서로 비교하는 작업은 결코 간단하지는 않다는 것이다. 이러한 고민을 해결해주는 2가지 라이브러리가 있는데, 인터랙티브 시각화를 제공해주는 Plotly.py 와 웹기반 파이썬 어플리케이션의 프레임워크를 제공해주는 Dash 가 바로 그것이다. 이하 그 사용법에 대해 알아보자. Dash Installation 먼저 예제 실행에 필요한 ..
꼭 알아둬야할 4가지 놀라운 파이썬 트릭 4 Uncommon Python Tricks You Should Learn
2020. 2. 15.Photo by Suzy Hazelwood from Pexels 1. Multiple Assignment 다수의 변수에 동일한 값을 줘야할 때, 종종 아래와 같이 변수 각각에 대해 값을 부여하는 것을 볼 수 있다. >>> a = 1 >>> b = 1 >>> c = 1 >>> print(a) 1 >>> print(b) 1 >>> print(c) 1 하지만 파이썬에서는 다음과 같이 한 번에 다수의 변수에 같은 값을 줄 수 있다. >>> a = b = c = 7 >>> print(a) 7 >>> print(b) 7 >>> print(c) 7 이 경우 모든 변수에는 체인의 가장 오른쪽에 있는 7이라는 값이 할당된다. 다음과 같이 7 대신 변수로도 대신할 수 있다. >>> val = 99 >>> a = b = c..
파이썬 - 숫자
2020. 2. 12.Photo by Magda Ehlers from Pexels 숫자의 결합 연산자 설명 예 결과 + 더하기 5 + 8 13 - 빼기 90 - 10 80 * 곱하기 4 * 7 28 / 부동소수점 나누기 (소수점 포함한 결과 출력) 7 / 2 3.5 // 정수 나누기 (소수점 이하 버림) 7 // 2 3 % 나머지 7 % 3 1 ** 지수 3 ** 4 81 정수 0 을 다른 숫자 앞에 넣을 수 없다 숫자와 연산자 사이의 공백은 무시된다 0 으로 나누는 경우 예외 발생 >>> 05 File "", line 1 SyntaxError: leading zeros in decimal integer literals are not permitted; use an 0o prefix for octal integers >>> ..
파이썬 - 변수, 이름, 객체
2020. 2. 12.변수, 이름, 객체 파이썬에서 모든 것(부울, 정수, 상수, 문자열, 데이터 구조, 함수, 프로그램)은 객체object 로 구현된다. 객체는 데이터가 담긴 투명한 플라스틱 박스다. 투명한 유리창으로 밀봉된 박스(값을 볼 수 있지만 바꿀 수는 없다)는 불변immutable , 열려있는 상자는 데이터 값 변경이 가능한 가변mutable 으로 볼 수 있다. 파이썬은 객체의 타입을 바꿀 수 없는 강타입이다. 변수는 단지 이름일 뿐이다. 메모리에 있는 값을 참조하기 위한 이름이다. = 을 통해 할당하게 된다. 할당이라는 의미는 값을 복사하는 것이 아니라 데이터가 담긴 객체에 그냥 이름을 붙이는 것이다. 포스트잇이라고 생각하면 된다. >>> a = 7 >>> print(a) 7 >>> 변수 이름 b도 7이 담긴 객..
엑셀과 파이썬 결합을 통한 강력한 엑셀 활용법 How to Supercharge Excel With Python
2020. 2. 6.Photo by Lukas from Pexels How to integrate Python and Excel with xlwings 엑셀과 파이썬을 결합하여 사용할 수 있다면, 엑셀에 날개를 다는 것이나 마찬가지다. xlwings 라고 불리는 파이썬 라이브러리는 이를 가능하게 해주는데, VBA 를 통해 파이썬 스크립트를 호출하여 데이터를 전달할 수 있게 한다. 그럼 아래에서 이에 대해 알아보자. 파이썬과 엑셀 VBA 통합 사용의 장점 VBA 로도 충분히 상당한 작업을 할 수 있다. 하지만 파이썬을 엑셀에 통합해서 사용해야하는 이유는 무엇일까? VBA 에 대한 지식 없이도 엑셀에서 커스텀 함수를 만들수 있다 아무래도 사용자들은 엑셀이 친숙하다 파이썬을 사용함으로써 확실히 데이터 작업 속도가 빨라진다 파이썬..
윈도우에 파이썬 및 pip 설치하기 Python & pip Windows installation
2020. 2. 3.금일 기준 윈도우용 파이썬 최신 버전은 3.8.1 이다. Latest Python 3 Release - Python 3.8.1 Python Release Python 3.8.1 The official home of the Python Programming Language www.python.org 아래 링크 최하단 Files 에서 설치 파일을 다운로드할 수 있다. https://www.python.org/downloads/release/python-381/ 아래 3가지 중 적당한 것을 다운로드 받은 후 설치한다. Windows x86-64 embeddable zip file Windows for AMD64/EM64T/x64 4d091857a2153d9406bb5c522b211061 8013540 SIG ..
spaCy 패키지와 코드를 통한 NLP 기초 다지기 Clear the Fundamentals of NLP with Code.
2019. 12. 14.본 포스팅에서는 최근 각광을 받고 있는 spaCy 패키지를 사용하여 NLP 의 기본내용을 코드 실행을 통해 살펴본다. spaCy 는 Explosion AI 의 Matt Honnibal 에 의해 개발된 것으로 “Industrial strength NLP in Python” 을 모토로 삼고 있다. 생산환경에서 주로 사용되며, 사용자 친화성과 객체 기반 접근방식을 통해 문자열이나 배열 대신 객체를 결과값으로 반환한다. NLTK 보다 나은 점 Cython 로 작성되어 엄청 빠른 속도를 선보인다 의존 구문 분석 커스토마이징이 손쉬운 대규모의 워드 벡터 접근 가능 통합된 워드 벡터 GPU 가속 지원 사용자 정의 딥러닝 네트워크 지원 하지만, NTNL 에 비해 매우 느린 문장 토큰화 속도 Prerequisites 다..