250x250
반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- API Gateway
- hadoop
- spark udf
- BigQuery
- Retry
- airflow subdag
- 공분산
- login crawling
- subdag
- XAI
- gather_nd
- correlation
- UDF
- Airflow
- grad-cam
- Counterfactual Explanations
- TensorFlow
- top_k
- 상관관계
- chatGPT
- 유튜브 API
- integrated gradient
- GCP
- API
- youtube data
- session 유지
- requests
- tensorflow text
- GenericGBQException
- flask
Archives
- Today
- Total
데이터과학 삼학년
language Model [uncased vs cased] 본문
반응형
자연어 처리 모델로 요즘 허깅페이스에서 pretrained model 많이 쓰는데..
모델중 -uncased, -cased 라는 명이 있다!
이것이 무엇을 의미하는 것일까?!
cased
- 텍스트 전처리 과정에서 별도의 처리를 하지 않고 문자 그대로 내놓는것
uncased
- 텍스트 전처리 과정에서 소문자 변환, 강조변환을 없애는 등 어느정도 데이터를 정제한 것
# BERT uncased
OpènGènus -> opengenus
OpenGenus -> opengenus
# BERT cased
OpènGènus
OpenGenus
참조
728x90
반응형
LIST
'Natural Language Processing' 카테고리의 다른 글
[Transformers] 파이토치 가중치만 있는 모델을 TF로 사용?! (0) | 2023.09.11 |
---|---|
[크롤링] 로그인이 필요한 웹사이트 크롤링 방법(feat. requests) (0) | 2023.03.20 |
PMI(Pointwise Mutual Information); 점별 상호 정보량 (0) | 2022.11.27 |
[크롤링] selenium implicitly Wait VS Explicitly Wait (0) | 2022.05.31 |
[크롤링] What is the differences between requests and selenium? (0) | 2022.05.27 |
Comments