일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- BigQuery
- API Gateway
- requests
- top_k
- API
- GenericGBQException
- flask
- correlation
- XAI
- hadoop
- grad-cam
- youtube data
- subdag
- TensorFlow
- 유튜브 API
- airflow subdag
- chatGPT
- login crawling
- session 유지
- spark udf
- GCP
- UDF
- 공분산
- 상관관계
- Airflow
- gather_nd
- Counterfactual Explanations
- Retry
- tensorflow text
- integrated gradient
- Today
- Total
목록전체 글 (424)
데이터과학 삼학년

SHAP을 활용한 기여도 시각화 - 의사결정 트리는 모델에 대한 해석이 쉽지만 많은 변수를 볼수 없고, 랜덤 포레스트는 모든 변수를 확인할 수는 있으나 feature 값이 커지면 결과의 변화정도를 알기 어려움 - 위와 같은 문제 해결을 위해 SHAP을 이용할 수 있음 (treeSHAP) - 아래 결과는 SHAP summary_plot - 세로축은 Feature importance 순서대로 나열 가로축은 SHAP value(0)를 기준으로 왼쪽일 수록 음의 방향으로 기여, 오른쪽일수록 양의 방향으로 기여 feature의 값을 의미하는 색 : 파란색은 낮은값, 빨간색은 높은 값 파란색이 왼쪽, 빨간색이 오른쪽으로 넓게 퍼져 있으면 feature값은 반응변수와 강한 양의 상관관계가 있고, 반대면 음의 상관관계..

AARRR - 중요한 것은 일을 "많이" 하는 것이 아니라 "지금 가장 필요한 일"에 집중해서 성과를 만들어 내는 것 - 사용자의 이용 흐름에 따른 핵심 지표를 정의하는데 매우 효율적으로 활용 가능 - 고객유치 -> 활성화 -> 리텐션 -> 수익화 -> 추천 - 사용자가 서비스에 진입하고, 핵심 기능을 사용하고, 결제하고, 이탈하는 라이프사이클 전반에 걸친 핵심 지표를 찾고 관리 Acquisition - 고객 유치 과정의 핵심은 고객 유치에 기여(Attribution)한 채널의 성과를 판단할 수 있는 모델을 만드는 것 - 어떤 채널을 통해 들어온 사용자들이 꾸준히 남아서 활동하는지, 결제로 전환되는 비율이 얼마나 되는지 Organic vs Paid user - Organic : 자발적으로 서비스에 찾아오..

클라이언트 측에서 동적 처리를 하는 웹페이지 예시 예시로 간단한 To-Do 리스트 애플리케이션 만들기!! 파일 구조 ├── static │ ├── script.js │ └── styles.css ├── templates │ └── index.html └── web.py HTML 파일 (index.html): To-Do List Add Task CSS 파일 (styles.css): body { font-family: Arial, sans-serif; margin: 20px; } #app { max-width: 400px; margin: 0 auto; } ul { list-style-type: none; padding: 0; } li { margin-bottom: 8px; } .completed { text..
파이썬은 정말 편한 언어다. 변수의 타입이나, 파라미터의 타입을 지정할 필요가 없다. 타입도 계속 바꿔서 사용할 수 있다. 그러나, 이런 타입을 지정해서 처리하는 방법도 있다. def example_function(param1: int = 0, param2: str = "default_value") -> str: # 함수 내용 result = f"{param1} - {param2}" return result # 함수 사용 예시 output = example_function(42, "custom_value") print(output) 숫자 덧셈 함수 def add_numbers(a: float, b: float) -> float: return a + b result = add_numbers(3.5, 2.7..
Growth Hacking Growth : 성장, Hacking : 해킹 -> 성장하는 방법을 해킹하는 것 - 크로스펑셔널한 직군의 멤버들이 모여 핵심지표를 중심으로 실험ㅇ르 통해 배움을 얻고, 이를 빠르게 반복하면서 제품이나 서비스를 성장시키는 것 크로스펑셔널 팀 (Cross-Functional Team) - 여러 직군 간 협업으로 그로스 해킹 - 디자이너, 마케터, 데이터 분석가 등 다양한 직군의 멤버들이 팀을 이루어 각자의 전문성을 발휘하며 시너지를 내야 함 린 스타트업(Lean Startup) - 시간과 자원이 부족한 스타트업이 성고하기 위해 실패로 인한 비용을 최소한으로 줄이고, 작은 성공 경험을 꾸준히 쌓아 나가는 방법 - 제품 개발 -> 지표 측정 -> 학습 및 개선 이라는 사이클을 빠르게 ..

내가 관리하는 깃헙에 내가 푼 알고리즘 문제가 자동으로 올라간다면?! 와우...이런것을 가능하게 만든 크롬 확장프로그램이 있다. 바로 백준허브!!!! 백준허브를 이용하면 자동으로 프로그래머스와 백준에서 푼 문제가 문제/풀이 함께 내 깃헙에 올라간다. 1. 백준허브 크롬 extension 설치 https://chromewebstore.google.com/detail/%EB%B0%B1%EC%A4%80%ED%97%88%EB%B8%8Cbaekjoonhub/ccammcjdkpgjmcpijpahlehmapgmphmk?hl=ko 백준허브(BaekjoonHub) Automatically integrate your BOJ submissions to GitHub chrome.google.com 2. 설치 후 나의 깃헙 주..
git revert VS git reset- 둘 다 Git에서 이전 커밋을 조작하는 데 사용되지만, 그 방식과 목적에 있어서 중요한 차이가 있음 1. git revert목적: 이전 커밋을 취소하고, 이전 상태로 돌아가면서 새로운 커밋을 생성 -> 다시 말해, 특정 커밋의 변경사항을 되돌리면서, 새로운 커밋을 만들어 현재 브랜치에 적용사용 시나리오: 이미 공유된 브랜치에서 커밋을 취소하고자 할 때, 특히 이미 리모트 저장소에 푸시된 상태에서 사용git revert 2. git reset목적: 특정 커밋을 특정 지점까지 하나 이상의 작업트리, 인덱스, 커밋에 대해 이전 상태로 되돌림 -soft, -mixed, -hard 와 같은 옵션을 사용하여 작업트리 및 인덱스까지 리셋 여부를 결정사용 시나리오: 로컬에..
소개 - 싱글턴 패턴은 어플리케이션에서 클래스의 인스턴스가 단 하나만 생성되도록 하는 디자인 패턴 중 하나 - 즉, class를 통해 여러 인스턴스를 생성하더라도 생성한 인스턴스는 하나의 포인터만 바라보게 되는 개념 - 파이썬에서는 이를 다양한 방식으로 구현 가능 1. 모듈을 이용한 싱글턴 - 가장 간단한 싱글턴 구현 방법 중 하나는 모듈을 이용. - 파이썬에서 모듈은 한 번만 로드되기 때문에 모듈 내부에 상태를 저장하여 싱글턴을 구현 가능 # singleton_module.py class SingletonClass: _instance = None def __new__(cls): if not cls._instance: cls._instance = super().__new__(cls) return cls...