감성 분석 Sentiment Analysis 내용 관련 예시 코드는 여기를 확인해주세요. 네이버 상품 리뷰와 뉴스 그룹 데이터 등을 사용하여 감정 분석을 실제 코드로 연습한 것입니다. 시각화를 이용하여 train set과 validation set의 accuracy를 확인하였습니다. 긍정적인 댓글을 남겼을 때, 부정적인 댓글을 남겼을 때의 pos/neg를 잘 구분해내어 확률을 나타내는지 확인할 수 있습니다. Deep Learning/Natural Language Processing 2022.03.29
백준 2839 #2839 n = int(input()) answer = 0 while n >= 0: if(n % 5) == 0: answer += (n // 5) print(answer) break n -= 3 answer += 1 else: print(-1) 처음에는 이 문제를 노가다로 풀려고 했는데 줄이 너무 길어져서 다시 고민했다. 힌트를 얻기 위해 검색하던 중, 이 문제가 그리디 알고리즘이라는 것을 알게 되었다. "그리디 알고리즘"은 잔돈 거슬러 주기에서 많이 쓰이는 알고리즘이라고 한다. 코드의 풀이를 하자면, n을 입력 받은 후, n이 가장 큰 수인 5로 나누어진다면 바로 답을 구하고, 그렇지 않으면 -3을 해줌으로써, 3으로 한 번 나누어졌다고 생각할 수 있으므로 answer에는 1을 더해준다. 이런 식으로.. Deep Learning/Algorithm 2022.03.29
백준 2775 #2775 t = int(input()) # test case for i in range(t): k = int(input()) # 층 n = int(input()) # 호 f0 = [x for x in range(1,n+1)] for j in range(k): for k in range(1,n): f0[k] += f0[k-1] print(f0[-1]) t는 test case, k,n은 각각 층과 호수라고 할 때, 손으로 직접 계산한다면 다음과 같다. 1호 2호 3호 0층 1 2 3 1층 1 3(1+2) 5(2+3) 2층 1 4 8 3층 1 5 12 위의 표처럼 만들어질 수 있도록 f0 list를 만들어준다. 그 후 층수에 대한 호수만큼 for문을 돌려 k층일 때, (k-1)층의 n의 호수만큼 더해준다. .. Deep Learning/Algorithm 2022.03.28
객체명 인식 Named Entity Recognition Named Entity Recognition 개체명 인식은 텍스트에서 이름을 가진 개체를 인식하는 기술 가령, '철수와 영희는 밥을 먹었다'에서 이름과 사물을 추출하는 개체명 인식 모델 결과 철수 - 이름 영희 - 이름 밥 - 사물 관련 내용 실습 예제는 여기를 확인해주세요. Deep Learning/Natural Language Processing 2022.03.28
합성곱 신경망 CNN Convolutional Neural Network, CNN 이미지 인식, 음성 인식 등에 자주 사용되는데, 특히, 이미지 인식 분야에서 거의 모든 딥러닝 기술에 사용 1989년 얀 르쿤(Yann LeCun) 교수의 논문에서 발표 필기체 인식에서 의미가 있었지만 범용화하는데에는 무리 1998년, "Gradient-Based Learning Applied to Document Recognition"이라는 논문에서 LeNet-5 제시 합성곱 층(convolution layer), 풀링 층(pooling layer) 소개 간단한 실습 예제 코드는 여기를 확인해주세요. + 스팸메일 분류기 with CNN 관련한 간단한 내용 정리는 제 tistory를 확인해주세요. Deep Learning/Natural Language Processing 2022.03.28
순환 신경망 RNN Recurrent Neural Network, RNN 순서가 있는 데이터를 입력으로 받음 변화하는 입력에 대한 출력을 얻음 시계열(날씨, 주가 등), 자연어와 같이 시간의 흐름에 따라 변화하고, 그 변화가 의미를 갖는 데이터 관련 예제 코드는 여기를 확인해주세요. 내용 설명은 다음 제 tistory를 확인하여 간단하게 보실 수 있습니다. Deep Learning/Natural Language Processing 2022.03.28
임베딩 Embedding Embedding 워드 임베딩은 단어를 컴퓨터가 이해하고, 효율적으로 처리할 수 있도록 단어를 벡터화하는 기술 워드 임베딩은 단어의 의미를 잘 표현해야만 하며, 현재까지도 많은 표현 방법이 연구 워드 임베딩을 거쳐 잘 표현된 단어 벡터들은 계산이 가능하며, 모델 투입도 가능 IMDB 데이터를 이용한 코드 연습입니다. 마지막에 시각화 부분은 사이트가 오픈되며 3차원으로 확인이 가능합니다. 자세한 코드는 여기서 확인해주세요. Deep Learning/Natural Language Processing 2022.03.28
군집 분석 Cluster Analysis Cluster Analysis 네이버 영화 리뷰 데이터를 이용한 군집 분석 예제 코드입니다. 군집 데이터는 유사한 특성끼리 묶어주어 분석합니다. 유사성을 기반으로 군집을 분류하고, 군집에 따라 유형별 특징을 분석하는 기법으로 간단한 연습 예제입니다. 자세한 코드는 여기서 확인해주세요. Deep Learning/Natural Language Processing 2022.03.28
키워드 분석 Keyword Analysis Keyword Analysis 네이버 영화 리뷰 데이터를 이용한 간단한 키워드 분석입니다. 마지막에는 wordcloud나 squarift를 이용한 시각화도 하였습니다. 자세한 코드는 여기를 확인해주세요. Deep Learning/Natural Language Processing 2022.03.28
자연어 처리 기초 Natural Language Processing 기초적인 부분으로 , 많이 사용되는 함수에 대한 언급을 시작으로 각각 예시를 들어 코드를 연습하였습니다. 필요한 함수가 많으므로 download 및 install을 하여 연습하였습니다. colab 환경에서 사용한 간단한 예제입니다. 자세한 코드는 여기를 확인해주세요. 사용된 모델의 간단한 정리는 제 tistory를 확인해주세요. + 추가 Deep Learning/Natural Language Processing 2022.03.28