Python Programming/Projects (7) 썸네일형 리스트형 Automation System for Crawling Information from Sustainalytics 1. Imports import pandas as pd import numpy as np import re import requests import bs4 from bs4 import BeautifulSoup from selenium import webdriver from selenium.common.exceptions import * from selenium.webdriver.common.keys import Keys import time data = pd.read_excel(r'C:\dataset\crawling_url_total_.xlsx') data company main_url sub_url 0 Novo Nordisk A/S https://www.novonordisk.com/ https://ww.. WebPage Content Crawling & Preprocessing Imports import pandas as pd import numpy as np import re import requests import bs4 from bs4 import BeautifulSoup from selenium import webdriver from selenium.common.exceptions import * from selenium.webdriver.common.keys import Keys import time 1. Data Load data = pd.read_csv(r'C:\dataset\URLS_1_75.csv') del data['Unnamed: 0'] data ETF Company base_url main_url ESG_related 0 EDEN Novo Nordisk h.. 기업의 ESG 요소와 수익률 간의 상관관계 분석(2) - Clustering Analysis Data Load from google.colab import drive drive.mount('/gdrive') Mounted at /gdrive import pandas as pd import numpy as np from sklearn.metrics import silhouette_score as sil from sklearn.cluster import KMeans import seaborn as sns from sklearn.manifold import TSNE import matplotlib.pyplot as plt Unnamed: 0 company code esg e s g AV ret sector sector_class AV_log ret_group sector_num sector_count.. 기업의 ESG 요소와 수익률 간의 상관관계 분석(1) - Data Prep & Exploration Data Preparation !pip install yfinance from google.colab import drive drive.mount('/gdrive') 먼저, 한국기업지배구조원에서 공개한 각 기업들의 ESG의 평가등급과 각 기업들의 수익률, 시가총액, 산업군을 column으로 한 데이터를 불러온다. ESG의 평가등급이 기업의 규모에 따라 상이할 수 있다는 가능성을 배제하지 못하기 때문에 독립변수로 로그화된 시가총액을 고려할 예정이다. 또한, ESG와 무관하게 특정 섹터의 수익률이 다른 산업군에 비해 상대적으로 높거나 낮을 수 있으므로 섹터의 영향 유무에 대한 분석을 함께 실시하고자 한다. 기업의 수는 약 560개이며, Data Preparation & Exploration 단계에서 변수들의.. 국가 및 연도 별 총생산량(GDP)과 1인당 GDP에 대한 비교분석(2) - 시각화와 결과 지난 번 국가 별 GDP 분석 포스팅에서는 데이터를 전처리하고(PigStorage) 시각화(Python Matplotlib)하는 과정에 대한 구현 코드를 소개하였다. 오늘은 해당 구현 코드를 실행하였을 때 얻을 수 있는 그래프와 시각화 결과에 대한 의미론적 해석을 중점으로 다룰 것이다. V. 데이터 분석 결과 - 국가별 2009년과 2019년의 1인당 GDP 1) 데이터 가시화 그래프 파란색 원 2019년의 1인당 GDP가 2009년과 비교하였을 때 상승하였음을 의미한다. 분홍색 원 2019년의 1인당 GDP가 2009년과 비교하였을 때 하락하였음을 의미한다. 원의 크기 원의 크기는 2009년과 2019년의 1인당 GDP 차이의 크기를 상징한다. 즉, 증가폭 및 감소폭을 나타낸다. 가시화된 결과를 통해 .. COVID19 - Consumption Pattern Change in Itaewon 0. COVID19 - Consumption Pattern Change in Itaewon * There was an administrative order after a large scale of infection of COVID19 that started from a club located in Itaewon. * The order was about the refrain from operating entertainment facilities (clubs, entertainment bars, etc.) * Effective period: 2020.05.08 ~ 2020.06.07 (1 month, can be extended) 1. Data Preprocessing * First of all, I col.. 국가 및 연도 별 총생산량(GDP)과 1인당 GDP에 대한 비교분석(1) I. 데이터분석 목적 1) 목적 연도별 각 국가의 GDP 및 1인당 GDP 데이터를 통해, 크게 아래의 세 가지를 주제로 비교분석할 것이다. * 특정 시점의 1인당 GDP에 대한 국가 간 횡단면 비교 * 한 국가의 성장을 나타내는 1인당 GDP의 시계열 분석 * 총생산량과 1인당 GDP 규모 간의 연관성 유무 분석 2) 얻고자 하는 Value * 1970년과 2019년의 국가 별 1인당 GDP 차이, 성장 수준 비교 * 각 대륙 별 대표 국가의 1인당 GDP 변화 비교 * 각 대륙 별 대표 국가의 총생산량 변화 비교 총생산량이 높은 국가가 1인당 GDP도 높을까? 1인당 GDP가 높은 대륙/국가? 총생산량이 높은 대륙/국가? II. 입력 데이터 한국은행에서 제공하는 경제통계 시스템을 활용하여 각 나라의 .. 이전 1 다음