728x90 문돌이 존버/코딩연습 01 문돌이 존버/코딩연습 2020. 7. 11. git 기본 지식 쌓기(1) git의 기본 구조는 아래와 같습니다. Working Directory는 본인이 작업하고 있는 공간이며, .git directory 에 파일을 업로드하기 위해선 Staging Area 를 거쳐야 하죠. 항상 파일 업로드는 Working Directory -> Staing Area -> .git directory 순서로 흘러갑니다. 아래는 파일에 대한 라이프 사이클을 표현한 것인데요. 화살표 방향을 잘 살펴보시면 플로우를 이해할 수 있을 겁니다. Git 기본 명령어 git add: 새로운 파일을 Staging area(준비영역)으로 보내기 git status: Staing file들의 상태 확인 git commit: .git 저장소 내에 staging 파일 저장 (추가: git commit -m "comm.. 02 문돌이 존버/코딩연습 2020. 3. 5. 웹스크래핑 + Tokenization + Lemmatization feat.파이썬 안녕하세요~ 이번엔 제가 지난 학기 학교 과제로 수행했던 CNN 기사를 웹스크래핑했던 코드를 공유하고자 합니다. 다음이 전반적인 과제 내용입니다. import requests from bs4 import BeautifulSoup import pandas as pd import os import natsort import re # 폴더 안에 있는 cnn html파일 읽어들이기 # html 파일 구조가 동일하지 않고 총 2가지로 분류되기 때문에 try와 except 활용 path = './cnn/' file_list = os.listdir(path) file_list = natsort.natsorted(file_list,reverse=False) df = pd.DataFrame(columns=['filena.. 03 문돌이 존버/코딩연습 2020. 1. 27. 동적 페이지 수집(Instagram) using Selenium 이 코드는 개인적으로 학습용으로 만든 노트에 불과합니다. 연세대학교 서중원님의 github를 그대로 참조해 공부했습니다. 감사합니다. import sys !{sys.executable} -m pip install selenium # 가상의 브라우저를 띄우기 위해 selenium 패키지 import import selenium from selenium import webdriver from selenium.webdriver.common.by import By # selenium을 활용해 브라우저를 직접 띄우는 경우, 실제 웹서핑을 할때처럼 로딩시간이 필요함 # 로딩시간 동안 대기하도록 코드를 구성하기위해 time 패키지 import import time from bs4 import BeautifulSoup.. 04 문돌이 존버/코딩연습 2020. 1. 24. Python을 이용한 네이버 뉴스 댓글 크롤링 이 코드는 개인적으로 학습용으로 만든 노트에 불과합니다. seodaeho91님의 블로그와 연세대학교 서중원님의 github를 그대로 참조했습니다. 감사합니다. import requests from bs4 import BeautifulSoup import pprint import json import re import sys List = [] url = "https://news.naver.com/main/ranking/read.nhn?mid=etc&sid1=111&rankingType=popular_day&oid=015&aid=0004278747&date=20200124&type=1&rankingSeq=2&rankingSectionId=105" res = requests.get(url) res.text o.. 이전 1 2 다음