728x90

Deep Learning/Natural Language Processing 23

임베딩 Embedding

Embedding 워드 임베딩은 단어를 컴퓨터가 이해하고, 효율적으로 처리할 수 있도록 단어를 벡터화하는 기술 워드 임베딩은 단어의 의미를 잘 표현해야만 하며, 현재까지도 많은 표현 방법이 연구 워드 임베딩을 거쳐 잘 표현된 단어 벡터들은 계산이 가능하며, 모델 투입도 가능 IMDB 데이터를 이용한 코드 연습입니다. 마지막에 시각화 부분은 사이트가 오픈되며 3차원으로 확인이 가능합니다. 자세한 코드는 여기서 확인해주세요.

자연어 처리 기초

Natural Language Processing 기초적인 부분으로 , 많이 사용되는 함수에 대한 언급을 시작으로 각각 예시를 들어 코드를 연습하였습니다. 필요한 함수가 많으므로 download 및 install을 하여 연습하였습니다. colab 환경에서 사용한 간단한 예제입니다. 자세한 코드는 여기를 확인해주세요. 사용된 모델의 간단한 정리는 제 tistory를 확인해주세요. + 추가

Document Classification (RNN)

document classification 관련 연습 코드는 여기를 확인해주세요! [2016] RNN for Multi-Task Learning ⓐ task 가 identical 하지만 datasets는 다르다. hidden layer structure은 공유하되, (task specific embedding + shared embedding) 두 가지의 embedding으로 동시에 학습시킨다. ⓑ hidden nodes는 서로 영향을 준다. ⓒ 각자의 hidden layer가 있어 m과 n에 대해 각각 수행하고, shared layer가 (m, n)을 같이 학습한다. RNN : Attention two main attention mechanisms ① Bahadanau attention : attent..

Document Classification (CNN)

document classification 관련 예시 코드는 여기를 확인해주세요. [2014] yoon-kim Input : n by k matrix representation of sentence - n : the number of words in a sentence (parameter) ▷ 짧은 문장은 zero padding을 주고 긴 문장은 trimmed - k : word embedding dimensions ▷ pre-trained word embedding vectors를 사용 ▷ vectors는 static (training 과정에서 update를 하지 않는다) or non-static (fine-tuning) - multi-channel input 가능하다. → 하나의 텐서 형태가 된다. ..

Document Classification (vector space model)

document classification 관련 예시 코드는 여기를 확인해주세요. Vector space model - A single document is transformed into a single vector : 각 문서(doc)에서 단어에 대한 p차원(본 그림에서는 5차원)인 vector로 표현하는 것이다. 여기서 자주 사용되는 DTM, Topic Models, Doc2Vec 등이 있습니다. Matrix-based Model - A document is represented as a NxP matrix ▷ N : single doc에서 단어들의 최대 수 (e.g. 512 of BERT) ▷ P : word embedding dimension (e.g. 128) : 위 그림에서 5차원의 embed..

[python] 3D 그래프

3D Axes 만들기 3D 그래프를 만들려면 3D 렌더링 기능을 가진 서브플롯을 작성할 필요가 있다. 다음과 같이 projection="3d"로 3D 렌더링 기능을 가진 서브플롯을 작성할 수 있다. matplotlib.fiture().add_subplot(1,1,1,projection="3d") Example1. import numpy as np import matplotlib.pyplot as plt #3d 렌더링에 필요한 라이브러리입니다. from mpl_toolkits.mplot3d import Axes3D %matplotlib inline t = np.linspace(-2*np.pi,2*np.pi) X,Y = np.meshgrid(t,t) R = np.sqrt(X**2 + Y**2) Z = np...

[python] 데이터 시각화_matplotlib

데이터 분석에 있어서 데이터 시각화는 매우 효과적인 수단입니다. matplotlib 라이브러리에는 데이터를 시각화하는 많은 기능이 들어 있습니다. 'matplotlib.pyplot.plot(x축에 대응하는 데이터, y축에 대응하는 데이터)'를 이용하면 그래프의 x축과 y축에 데이터를 간단히 대응시켜 차트를 만들 수 있습니다. Example. - 3x2의 그래프 레이아웃을 만들어 상단에는 왼쪽부터 순서대로 𝑦=𝑥, 𝑦=𝑥^2, 𝑦=𝑥^3 의 그래프를, 하단에는 왼쪽부터 순서대로 𝑦=𝑠𝑖𝑛(𝑥), 𝑦=𝑐𝑜𝑠(𝑥), 𝑦=𝑡𝑎𝑛(𝑥) 의 그래프를 플롯하세요. - 각각의 서브플롯에 적절한 제목을 붙이고, 그리드를 표시하세요. - 상단에는 _upper가 붙은 변수를, 하단에는 _lower가 붙은 변수를 사용하세요...

728x90
반응형