전체 글(63)
-
'여덟단어'를 읽고
필자는 글을 잘 쓰는 것도, 말을 잘하는 것도 아니지만 사소하더라도 작은 단어의 의미에 신경을 꽤 쓰는 편이다. 그런 필자에게 인생과 관련하여 여덟 단어를 함께 생각해보고 싶다는 글귀는 책에 매료시키는데 충분했다. 여덟 단어는 필자에 대해 이해하고 목적지를 뚜렷하게 만들어주는 책이자 서두르지 않아도 된다고 좋아하는 것을 선택해도 된다고 응원해주는 책이다. 저자는 '자존', '본질', '고전', '견', '현재', '권위', '소통', '인생' 여덟 가지 키워드에 대해 본인의 생각을 말하고 이 여덟 개의 단어가 결국 연결이 되어 하나의 방향으로 갈 것이라고 말한다. 이 단어들 중 가장 와닿았던 단어들인 자존, 본질, 현재에 대해 이야기하고자 한다. 자존 행복한 삶의 기초가 되는 것은 스스로를 존중하는 마음..
2021.03.30 -
Youtube 인기 급상승 동영상 Analysis (1)
이번 글은 Youtube 인기 급상승 동영상을 분석하기 위해 인기 급상승 동영상 데이터를 수집할 것입니다. 순서 1. 분석 배경 2. 데이터 수집 3. selenium 알아보기 3.1. 웹요소 접근 메소드 3.2. 액션 체인 3.3. BeautifulSoup과 Selenium 3.4. 자바스크립트로 동작시키는 방법 3.5. Headless 모드 1. 분석 배경 유튜브 인기 급상승 동영상은 다양한 시청자의 관심을 끄는 영상으로 크리에이터의 다양성을 보여주는 영상, 흥미와 새로움을 느낄 만한 영상이 업로드됩니다. 조회수, 동영상 조회수 증가 속도, Youtube 외부를 포함하여 조회수가 발생하는 소스, 동영상 업로드 기간, 해당 동영상을 같은 채널에 최근 업로드한 다른 동영상과 비교한 결과를 고려하여 약 1..
2021.03.22 -
[Algorithm] 가능한 모든 경우의 수를 시도하는 순진한 알고리즘, Broute Force?
이번글은 가능한 모든 경우의 수를 시도하는 알고리즘 Broute Force에 대해 알아보겠습니다. 1. Broute Force Brute Force 알고리즘은 무차별 대입 공격으로 가능한 모든 경우를 시도하는 순진한 알고리즘입니다. 가능한 모든 경우를 시도하기 때문에 완전 탐색 알고리즘입니다. 직관적이고 명확한 알고리즘으로 답을 확실하게 알 수 있지만 input이 크면 비효율적이라는 단점을 갖고 있기 때문에 작은 경우에만 효율적입니다. Brute Force알고리즘으로 문제를 해결하는 과정은 다음과 같습니다. 이전 포스팅에서 다뤘던 순차 탐색도 Brute Force알고리즘을 이용하여 문제를 푸는 방식입니다. 선형 구조를 모두 탐색하는 방법 중 이전 포스팅에 다뤘던 선형 탐색(순차 탐색)도 Brute For..
2021.03.21 -
[Algorithm] 선형 구조에서의 탐색, 선형탐색과 이진탐색
이번 글은 선형구조에서 특정 값을 찾고 싶을 때 어떻게 탐색하는 것이 효율적인가에 대한 알고리즘을 설명합니다. 순서 1. 선형탐색과 이진탐색 이론 2. 파이썬 구현 1. 선형탐색과 이진탐색 이론 만약 도서관에서 "여덟단어" 책을 찾으려고 할 때 어떻게 찾을 것인가요? 도서관에 책이 왼쪽에서 오른쪽으로 자음 순서대로 있다고 할 때 왼쪽부터 순서대로 찾을 수도 있고 중간 자음인 'ㅅ'을 찾은 후 'ㅅ'을 기준으로 오른쪽 책들만 확인해서 찾아볼 수도 있을 것입니다. 이처럼 왼쪽부터 차례대로 탐색하는 것을 선형탐색 또는 순차탐색, 중간 위치를 찾아서 탐색할 범위를 줄여 탐색하는 것을 이진탐색이라고 합니다. 아래 그림처럼 주어진 데이터를 처음부터 검색하는 것이 선형탐색이고, 이진탐색은 정렬된 데이터의 중앙값을 이..
2021.03.21 -
[통계분석] 06. 회귀분석 그게 뭐야?
이번 글은 회귀분석에 관한 내용입니다. 순서 1. 선형함수와 선형회귀분석 2. 단순선형회귀분석과 다중선형회귀분석 1. 선형함수와 회귀분석 아래 그림과 같이 독립변수와 종속변수 간 관계를 파란 하나의 직선으로 나타낼 수 있습니다. 이 선은 데이터를 가장 잘 설명할 수 있는 선으로 함수로 표현하면 $Y = aX+b+오차항$ 입니다. 이처럼 데이터 집합 X에 대해 가장 잘 설명할 수 있는 선형 함수를 구할 수 있습니다. 이 함수는 독립변수 X가 한 단위 증가할 때 Y값은 변동량을 뜻합니다. Y, X가 주어져있을 때 a, b, 오차항을 추정하는 것입니다. a는 x가 1단위 변할 때 y가 얼만큼 변하는가를 나타내는 기울기, b는 y절편을 뜻합니다. 오차항의 오차는 모집단에서 얻은 회귀실을 통한 예측값과 실제값의 ..
2021.02.02 -
[통계분석] 05. 범주형 변수, 어떤 검정을 할 수 있을까?
이번 글은 범주형 변수에 대한 가설을 검정하는 독립성 검정과 적합성 검정, 동질성 검정에 대한 내용입니다. 글의 내용은 순천향대학교 김영민 교수님의 강의를 바탕으로 정리한 자료임을 먼저 말씀드립니다. 순서 1. 분할표와 카이제곱 2. 카이제곱 검정 1. 분할표 검정에 대해 알아보기 전 분할표에 대해 알아보겠습니다. 분할표는 아래 표와 같이 데이터를 분류하는 통계 기법 하나로 두 범주형 변수에 대한 교차 빈도수를 나타낸 표입니다. 두 변수의 범주들이 교차하는 칸마다 각 변수의 범주를 동시에 갖는 관측값들의 수를 그 칸의 도수로 기록한 것입니다. 도수분포표를 2차원으로 확장한 형태라고 생각하시면 됩니다. 이 표는 파트너가 존재하는 사람들에 따라 고객 이탈 유무에 차이가 있는지 확인하기 위한 분할표입니다. P..
2021.02.02