250x250
반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- flask
- GCP
- Retry
- requests
- Airflow
- API
- UDF
- chatGPT
- XAI
- integrated gradient
- tensorflow text
- top_k
- session 유지
- spark udf
- 상관관계
- GenericGBQException
- subdag
- gather_nd
- youtube data
- 공분산
- BigQuery
- 유튜브 API
- TensorFlow
- airflow subdag
- hadoop
- API Gateway
- grad-cam
- Counterfactual Explanations
- correlation
- login crawling
Archives
- Today
- Total
데이터과학 삼학년
language Model [uncased vs cased] 본문
반응형
자연어 처리 모델로 요즘 허깅페이스에서 pretrained model 많이 쓰는데..
모델중 -uncased, -cased 라는 명이 있다!
이것이 무엇을 의미하는 것일까?!
cased
- 텍스트 전처리 과정에서 별도의 처리를 하지 않고 문자 그대로 내놓는것
uncased
- 텍스트 전처리 과정에서 소문자 변환, 강조변환을 없애는 등 어느정도 데이터를 정제한 것
# BERT uncased
OpènGènus -> opengenus
OpenGenus -> opengenus
# BERT cased
OpènGènus
OpenGenus
참조
BERT cased vs BERT uncased
We have explored the difference between BERT cased and BERT uncased. BERT uncased and BERT cased are different in terms of BERT training using case of text in WordPiece tokenization step and presence of accent markers.
iq.opengenus.org
728x90
반응형
LIST
'Natural Language Processing' 카테고리의 다른 글
[Transformers] 파이토치 가중치만 있는 모델을 TF로 사용?! (0) | 2023.09.11 |
---|---|
[크롤링] 로그인이 필요한 웹사이트 크롤링 방법(feat. requests) (0) | 2023.03.20 |
PMI(Pointwise Mutual Information); 점별 상호 정보량 (0) | 2022.11.27 |
[크롤링] selenium implicitly Wait VS Explicitly Wait (0) | 2022.05.31 |
[크롤링] What is the differences between requests and selenium? (0) | 2022.05.27 |
Comments