(솔트룩스 세미나) 융합 신경망 기발 복합지식 추출 - 강원대 김학수 교수님
2022. 5. 20. 15:59ㆍmachine learning
728x90
반응형
<융합 신경망 기발 복합지식 추출 - 강원대 김학수 교수님 >
Triple: 주어(Subject) – 서술어(Predicate) – 목적어(Object). 시멘틱 웹기반 온톨로지의 가장 기본단위.
복합 지식 추출: entities, concepts, kindOf의 관계성을 관찰.
복합 지식의 추출의 어려운 이유.
현재 가장 성능 좋은 개체명 인식모델
Semi-supervised model=
Distant supervision(원거리 감독법: 관계의 의미 내포)
+ Bagging based active learning(기존 개체명 분석+노이즈제거)
일반영역의 모델결과: 평균 75% (대상: 학습 54000문장, 평가 1000문장.)
특정 도메인의 결과: 평균 90%로 상승가능.
기존 연구의 문제점: 한 문장당 개체가 한쌍만이 존재가정 + 두 개체간의 관계 추출.
연구 문제해결 방법: 듀얼포인터 네트워크.
듀얼포인터 네트워크 결과
영문: 약 78% (대상: NYC, 66202 문장, 평가 6621문장 대상)
한글: 약 72% (대상: DBPedia 한국어, 3566문장, 평가 512문장 대상)
앞으로의 연구방향
728x90
반응형
'machine learning' 카테고리의 다른 글
(솔트룩스 세미나) 딥러닝기반의 지식학습과 심층 질의응답 – 정용일 연구위원님 (0) | 2022.05.20 |
---|---|
(솔트룩스 세미나) BERT기반 자연언어처리 – 양승원 연구위원님 (0) | 2022.05.20 |
솔트룩스 세미나-뉴로 심볼릭AI by 이경일 대표 (0) | 2022.05.20 |
머신러닝의 자연어처리기술 NLP (0) | 2022.05.16 |
추천시스템 알고리즘 - 협업필터링, 컨텐츠 기반 추천 유형 (0) | 2022.03.25 |