데이터과학 삼학년

Cloud Natural Language API (GCP) 본문

GCP

Cloud Natural Language API (GCP)

Dan-k 2020. 6. 1. 15:05
반응형

Natural Language API (GCP)

  • GCP 에서 지원해 주는 Text 분석을 위한 API

  • 분석 종류에 따라 다양한 언어 지원 (20~100 여개국)

  • 분석 종류

    • Entities

      • 문장의 parsing된 단어들의 성격을 유추

    • Sentiment

      • 문서나 문장의 감정 수준 분석

    • Syntax

      • 형태소 종류, parse label, 의존성, 의미구 등 문장을 자른 기준들을 파악할 수 있음

    • Categories

      • 문장이 어느 분류에 속하는지 분류 문제 해결

  • 이용 가격

 

Morphs analysis using Natural Language API (GCP)

  • 형태소 분해

    • Cloud Natural Language api의 syntax 분석을 이용하여 morphs 분해 가능

from google.cloud import language
from google.cloud.language import enums
from google.cloud.language import types

# 형태소 분석
def gnl_syntax(s):
    client = language.LanguageServiceClient()
    document = {"content": s, "type": enums.Document.Type.PLAIN_TEXT}   # , "language": "en"
    response = client.analyze_syntax(document, encoding_type=enums.EncodingType.UTF8)
    syntax_list = []

    for token in response.tokens:
        text = token.text.content
        part_of_speech = token.part_of_speech
        pumsa = enums.PartOfSpeech.Tag(part_of_speech.tag).name
        syntax_list.append((text,pumsa))

    return syntax_list

======
예시
[('사랑', 'NOUN'), ('해', 'AFFIX'), (',', 'PUNCT'), ('사랑', 'NOUN'), ('한다', 'AFFIX'), ('고', 'PRT'), ('.', 'PUNCT'), ('좋아해', 'VERB'), (',', 'PUNCT'), ('좋아한다', 'VERB'), ('고', 'PRT'), (',', 'PUNCT'), ('좋아해버려', 'NOUN'), (',', 'PUNCT'), ('좋아질', 'VERB'), ('텐', 'NOUN'), ('데', 'NOUN'), (',', 'PUNCT'), ('좋아할걸', 'ADJ'), ('행복', 'NOUN'), ('하구나', 'AFFIX'), ('.', 'PUNCT'), ('이거나', 'VERB'), ('먹어', 'VERB'), ('라', 'VERB'), ('.', 'PUNCT'), ('넌', 'NOUN'), ('어때', 'ADJ'), ('?', 'PUNCT'), ('이것', 'PRON'), ('이야말로', 'PRT'), ('궁극', 'NOUN'), ('의', 'PRT'), ('스파게티지', 'NOUN'), ('난', 'VERB'), ('최고', 'NOUN'), ('의', 'PRT'), ('아티스트라구', 'NOUN'), ('요', 'PRT')]



728x90
반응형
LIST

'GCP' 카테고리의 다른 글

GCP ai-platform (cloudML)에서 환경 설정 (라이브러리 추가)-setup.py  (0) 2020.06.24
AutoML TimeSeries forecasting  (0) 2020.06.02
AutoML Natural Language 소개  (0) 2020.05.22
Dataflow SQL  (0) 2020.04.06
GCP AI-platform Stream Logs error  (0) 2020.02.22
Comments