Machine Learning
torchtext 정리
송주환
2019. 1. 14. 13:54
torchtext란?
- nlp에 필요한 pytorch 모듈이다.
1.TabularDataset
-> path, format, field로 구성이 되어있으며 filed는 column 형식으로 객체 생성을 하게 된다.
-> format은 csv,tsv,json 형식의 파일이 있다.
TEXT.build_vocab를 사용했을때, pretrained 된 model들은
https://github.com/pytorch/text/blob/v0.2.1/torchtext/vocab.py#L379
여기서 어떤 모델을 받는지 확인할 수 있다.