Stage1 - 파이썬과 오픈소스 패키지

우리가 만들 데이터수집기는 파이썬 오픈소스 패키지를 통해 만듭니다. 첫번째 스테이지에서는 오픈소스 패키지의 개념과 설치방법에 대해 공부합니다.

파이썬 오픈소스 패키지(Package)

지난주차 첫스테이지에서 파이썬은 프로그래밍 언어이기 때문에 누구나 무료로 사용/수정/재배포까지 할 수 있습니다. 그렇기 때문에 많은 사람들이 파이썬을 활용해서 만든 유용한 기능들을 만들어서 공유하고 있습니다.

개인 또는 회사가 작성하여 무료로 배포하는 코드들을 오픈소스 패키지라고 부르며 우리가 익숙한 웹서비스들의 기능들도 이러한 오픈소스 패키지를 활용하여 만든 경우가 많습니다.

대표적인 파이썬 오픈소스 패키지

Django(장고)

Django는 파이썬을 통하여 웹서비스를 개발할 수 있는 패키지입니다. 가장 널리 알려져있는 패키지 중에 하나로 웹개발을 위해 필요한 것들을 이미 구현해놓았기 때문에 상대적으로 초심자도 쉽게 웹개발을 시작할 수 있습니다.

Django를 활용해 구현한 웹서비스: Instagram, Youtube

Flask(플라스크)

Flask 역시 파이썬으로 웹개발을 할 수 있는 패키지입니다. Django보다 가벼운 패키지로 웹개발을 위해 필요한 최소한의 기능이 구현되어있기 때문에 숙련자가 사용하기 좋은 패키지입니다.

Flask를 활용해 구현한 웹서비스: Pinterest, Linkedin

Pandas(판다스)

Pandas는 시트형태(엑셀, 구글 스프레드시트)의 데이터를 파이썬을 통해 쉽게 다룰 수 있게 하는 패키지입니다. 주로 통계, 데이터분석의 프로젝트에서 주로 활용됩니다.

Reqeusts(리퀘스츠)

웹상의 데이터를 가져올 수 있는 패키지 입니다. 데이터를 요청하고, 요청한 데이터를 받아 활용할 수 있습니다. 코알라 데이터수집에서도 Requests를 활용해서 데이터 수집기를 만듭니다.

BeatifulSoup4(뷰티풀수프4)

BeautifulSoup4(BS4)는 소스코드를 파싱하여 원하는 데이터를 선택/수집할 수 있게 도와주는 패키지 입니다. BS4를 사용하면 앞에서 배운 선택자를 통해 데이터를 선택할 수 있습니다.

오픈소스 패키지 다운로드/사용

스마트폰 앱다운로드: Google Play/App Store
파이썬 패키지 다운로드: Python Package Index(PIP)

그럼 오픈소스 패키지는 어디에서 다운받아서 사용할 수 있을까요? 스마트폰에서 어플리케이션을 다운받기 위해 Google Play나 App Store를 활용하는 것처럼 파이썬에서는 Python Package Index(PIP)를 활용하면 쉽게 오픈소스 패키지들을 다운로드받고 또 업데이트할 수 있습니다.

오픈소스 패키지 설치하기(PIP 사용법)

명령어로 설치하기

가장 정석적인 패키지 설치 방법은 터미널(명령 프롬프트)에서 명령어를 사용하는 것입니다.

파이참 하단의 Terminal 선택

파이참을 켜고 아래 실행영역의 Terminal 탭을 클릭하면 위와 같이 커서가 깜빡거리는 것을 확인할 수 있습니다. 이 창은 컴퓨터를 명령어로 제어할 수 있는 창입니다. 윈도우의 명령프롬프트(cmd), 맥의 터미널(Terminal)과 같은 창이라고 생각하시면 됩니다.

터미널 창에 아래와 같이 명령어를 입력하면 원하는 패키지가 설치됩니다.

pip install 패키지

이번 스터디에서 활용할 reqeusts를 명령어를 통해서 설치해봅시다.

pip install requests를 입력하면 requests가 설치된다.

위와 같이 터미널 창에 pip install requests를 입력하면 쉽게 requests 패키지를 설치할 수 있습니다. 아래 명령어들을 통해 패키지 업그레이드와 삭제도 가능합니다. pip를 통해서 패키지를 다운로드하는 작업은 인터넷이 연결되어 있어야만 합니다.

# 패키지 설치
pip install 패키지이름
# 패키지 업데이트
pip install --upgrade 패키지이름
# 패키지 삭제
pip uninstall 패키지이름
bash: pip: command not found

*위와 같은 에러가 발생하는 경우에는 아래의 파이참을 통해 설치하기 방법으로 패키지를 설치해주시면됩니다.

파이참으로 설치하기

명령어를 통해 오픈소스 패키지를 설치하는 방밥의 경우 내가 다운받고자하는 패키지의 이름을 정확히 알고있어야하고, 터미널 명령어에 익숙하지 않은 사용자는 쉽게 사용할 수 없다는 단점들이 있습니다.

하지만 파이참을 활용하면 초심자도 쉽게 오픈소스 패키지를 검색하고 설치할 수 있습니다. 아래 순서에 따라 오늘 활용할 BeautifulSoup4를 파이참을 통해 설치해봅시다.

#1. 파이참 환경설정을 켭니다.
#2. 환경설정의 Project:프로젝트명 > Project Interpreter에서 +버튼을 클릭합니다.
#3. 설치하고싶은 패키지를 검색한 후 설치합니다.

위의 순서를 따라하면 원하는 패키지를 쉽게 설치할 수 있습니다. 이처럼 파이참은 자체적으로 pip 명령어로 할 수 있는 기능을 그래픽적으로 구현해놓았기 때문에 쉽게 사용할 수 있습니다. 설치뿐만 아니라 지금 내 파이썬에 어떤 패키지들이 설치되어있는지 쉽게 확인할 수 있고, 패키지의 정보와 버전관리도 훨씬 쉽게 할 수 있습니다.

pip 기본 명령어에 대해 알아두시되 초심자라면 파이참을 통해서 패키지를 설치하는 방법을 추천드립니다 :)