We-Co

[We-Co] SQuAD Dataset - Tensorflow, NLP, Transformer 본문

Python/Tensorflow

[We-Co] SQuAD Dataset - Tensorflow, NLP, Transformer

위기의코딩맨 2022. 2. 16. 21:27
반응형

안녕하세요. 위기의 코딩맨입니다.

오늘은 BERT를 기반으로 사용하는 SQuAD Dataset에 대해서 간단하게 알아보고 구현해보도록 하겠습니다.

 

BERT에 대해서 궁금하시면

BERT

 

[We-Co] BERT - 자연어처리, NLP

안녕하세요. 위기의 코딩맨입니다. 오늘은 자연어 처리의 발전에 힘을 실어준 BERT 모델에 대해서 알아보도록 하겠습니다. [ BERT ] Bidirectional Encoder Representations from Transformers를 BERT로 간단하게..

we-co.tistory.com

[ SQuAD Dataset ]

 

Stanford Question Answering Dataset을 SQuAD로 요약하여 부르며

Wikipedia와 크라우드 워커의 질문으로 구성된 Dataset입니다.

V1.1과 V2.0을 사용하는데 V2.0은 답변이 없는 데이터도 추가된 데이터를 사용합니다. 

 

질문에 대한 답변은 Text or 범위로 구성되어 있습니다.

또한, 500이상의 Wikipedia 기사를 통해 100,000개 이상의 질문 - 답변의 쌍으로 구성됩니다.

 

[ 출처 : https://mccormickml.com/2020/03/10/question-answering-with-a-fine-tuned-BERT/ ]

 

https://rajpurkar.github.io/SQuAD-explorer/

 

The Stanford Question Answering Dataset

What is SQuAD? Stanford Question Answering Dataset (SQuAD) is a reading comprehension dataset, consisting of questions posed by crowdworkers on a set of Wikipedia articles, where the answer to every question is a segment of text, or span, from the correspo

rajpurkar.github.io

해당 링크를 들어가시면 사용되는 데이터의 구성과 설명을 직접 확인할 수 있습니다.

 

SQuAD 구성

Question + Paragraph를 Input Data로 보내고

Sentence A & Sentence B로 묶어서 처리하게 됩니다.

 

FIne-Tuning Data 학습에 대한 세팅은 다음과 같이 구성되어있습니다.

Epoch : 3

Learning Rate : 5e-5(0.00005

batch size : 32

 

해당 데이터 셋의 성능 평과 방식은 크게 2가지 방식이 존재하는데

 

1. Exact Match, 즉 EM 방식이라고 하며,

예측한 답변과 실제의 답변이 정확하게 일치하는지 비교,

Ground Truth 중 1개라도 동일하게 되면 1, 동일하지 않다면 0을 반환하는 방식입니다.

 

2. F1 Score 방식으로 정답과 일치하는 Token의 비율을 F1 Score로 계산하는 방식입니다.

 

 

[ 출처 : https://dos-tacos.github.io/paper%20review/BERT/ ]

기존 모델 대비 높은 Stsate-of-the- art 성능의 EM, F1 Score의 성능을 보여주었습니다.

오늘은 BERT를 기반으로 사용하는

SQuAD에 대해 간단하게 알아보았습니다.

다음시간에 이 Dataset을 이용해보는 시간을 가져보겠습니다.

반응형