250x250
반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 유튜브 API
- GenericGBQException
- login crawling
- hadoop
- grad-cam
- top_k
- API
- tensorflow text
- 공분산
- integrated gradient
- subdag
- XAI
- airflow subdag
- spark udf
- correlation
- Retry
- 상관관계
- youtube data
- chatGPT
- TensorFlow
- session 유지
- gather_nd
- GCP
- Counterfactual Explanations
- API Gateway
- Airflow
- UDF
- BigQuery
- flask
- requests
Archives
- Today
- Total
데이터과학 삼학년
Cloud Natural Language API (GCP) 본문
반응형
Natural Language API (GCP)
-
GCP 에서 지원해 주는 Text 분석을 위한 API
-
분석 종류에 따라 다양한 언어 지원 (20~100 여개국)
-
분석 종류
-
Entities
-
문장의 parsing된 단어들의 성격을 유추
-
Sentiment
-
문서나 문장의 감정 수준 분석
-
Syntax
-
형태소 종류, parse label, 의존성, 의미구 등 문장을 자른 기준들을 파악할 수 있음
-
Categories
-
문장이 어느 분류에 속하는지 분류 문제 해결
-
이용 가격
Morphs analysis using Natural Language API (GCP)
-
형태소 분해
-
Cloud Natural Language api의 syntax 분석을 이용하여 morphs 분해 가능
from google.cloud import language
from google.cloud.language import enums
from google.cloud.language import types
# 형태소 분석
def gnl_syntax(s):
client = language.LanguageServiceClient()
document = {"content": s, "type": enums.Document.Type.PLAIN_TEXT} # , "language": "en"
response = client.analyze_syntax(document, encoding_type=enums.EncodingType.UTF8)
syntax_list = []
for token in response.tokens:
text = token.text.content
part_of_speech = token.part_of_speech
pumsa = enums.PartOfSpeech.Tag(part_of_speech.tag).name
syntax_list.append((text,pumsa))
return syntax_list
======
예시
[('사랑', 'NOUN'), ('해', 'AFFIX'), (',', 'PUNCT'), ('사랑', 'NOUN'), ('한다', 'AFFIX'), ('고', 'PRT'), ('.', 'PUNCT'), ('좋아해', 'VERB'), (',', 'PUNCT'), ('좋아한다', 'VERB'), ('고', 'PRT'), (',', 'PUNCT'), ('좋아해버려', 'NOUN'), (',', 'PUNCT'), ('좋아질', 'VERB'), ('텐', 'NOUN'), ('데', 'NOUN'), (',', 'PUNCT'), ('좋아할걸', 'ADJ'), ('행복', 'NOUN'), ('하구나', 'AFFIX'), ('.', 'PUNCT'), ('이거나', 'VERB'), ('먹어', 'VERB'), ('라', 'VERB'), ('.', 'PUNCT'), ('넌', 'NOUN'), ('어때', 'ADJ'), ('?', 'PUNCT'), ('이것', 'PRON'), ('이야말로', 'PRT'), ('궁극', 'NOUN'), ('의', 'PRT'), ('스파게티지', 'NOUN'), ('난', 'VERB'), ('최고', 'NOUN'), ('의', 'PRT'), ('아티스트라구', 'NOUN'), ('요', 'PRT')]
728x90
반응형
LIST
'GCP' 카테고리의 다른 글
GCP ai-platform (cloudML)에서 환경 설정 (라이브러리 추가)-setup.py (0) | 2020.06.24 |
---|---|
AutoML TimeSeries forecasting (0) | 2020.06.02 |
AutoML Natural Language 소개 (0) | 2020.05.22 |
Dataflow SQL (0) | 2020.04.06 |
GCP AI-platform Stream Logs error (0) | 2020.02.22 |
Comments