Deep Learning/Natural Language Processing

KG graph with ESG data

frances._.sb 2023. 8. 2. 18:32
728x90

앞선 실험을 엎은 후, 새로운 아이디어를 찾던 중,

원래 graph와 recommendation system에 관심이 있어 고민을 하였다. 왜냐.. 공부도 새로 시작해서 알아봐야 했고, 일단 어려웠기 때문이다.

 

그러던 중, KG로 맘을 굳히고 공부를 해보기로 하였다.

 

 

 

문장이 clustering이 되어서 저런 식의 이쁜 그래프를 만들기를 원했다.

포부도 좋았고, 이게 된다면 석사 한 학기만에 졸업 논문은 끝..이라고 생각할 정도로 맘에 들었다.

 

하지만, 물론 나는 쉽게 생각했던 것이었으며... 결과는 꽤나 참담(?)했다.

 

 

 

 

일단 한국어 triplet을 만드는 것부터 어려웠다.

여러 손 쉬운 방법도 사용해 보고, 끝이 보이지 않을 rule-based도 사용해 보았지만 한국어 triplet은 너무 어려운 것..

 

 

 

 

KG 그래프의 전처리 전? 모습이라고 볼 수 있다. 데이터가 워낙 많으니 전혀 인사이트가 보이지 않는 모습이다.

 

 

 

 

 

조금 다듬어 보았을 때의 모습이다.

사실 이거만 보았을 때 다른 사람들은 된 게 아니냐고 했지만, 내가 원한 건 각 class가 clustering이 된 후, 서로 어떤 단어가 중복이 되어 인사이트를 주는지를 확인하고 싶었다.

 

 

 

 

물론 이것도 아쉬운 결과 ㅎ

조금 더 손 봐야겠다라고 생각하고 Neo4j를 사용해서 좀 더 보기 쉽게 하였다.

 

 

 

그림은 그럴싸해보이지만, 결론적으로 교수님은 이것도 contribution이 보이지 않는다고 하셨다.

 

 

 

 

사실 나도 위와 같은 결과를 보고 싶었는데 생각보다 더 어려운 존재였던 KG....

 

방향성을 찾는 건 참 어려운 일인 것 같다. 

728x90
반응형