(솔트룩스 세미나) 융합 신경망 기발 복합지식 추출 - 강원대 김학수 교수님

2022. 5. 20. 15:59machine learning

728x90
반응형

<융합 신경망 기발 복합지식 추출 - 강원대 김학수 교수님 >

Triple: 주어(Subject) – 서술어(Predicate) – 목적어(Object). 시멘틱 웹기반 온톨로지의 가장 기본단위.

복합 지식 추출: entities, concepts, kindOf의 관계성을 관찰.

 

복합 지식의 추출의 어려운 이유.

  

현재 가장 성능 좋은 개체명 인식모델

Semi-supervised model=

Distant supervision(원거리 감독법: 관계의 의미 내포)

+ Bagging based active learning(기존 개체명 분석+노이즈제거)

일반영역의 모델결과: 평균 75% (대상: 학습 54000문장, 평가 1000문장.)

특정 도메인의 결과: 평균 90%로 상승가능.

 

기존 연구의 문제점: 한 문장당 개체가 한쌍만이 존재가정 + 두 개체간의 관계 추출.

연구 문제해결 방법: 듀얼포인터 네트워크.

듀얼포인터 네트워크 결과

영문: 78% (대상: NYC, 66202 문장, 평가 6621문장 대상)

한글: 72% (대상: DBPedia 한국어, 3566문장, 평가 512문장 대상)

 

앞으로의 연구방향

728x90
반응형