스파르타코딩클럽에서 데이터분석종합반 강의를 신청했다.
강의를 신청한 이유이자... 학습 목표는
1. 파이썬을 이용하여 빅데이터를 다룰 수 있다.
2. 파이썬을 이용하여 빅데이터 시각화를 할 수 있다.
3. 약간의 머신러닝을 사용할 수 있다.
결국은 1) 파이썬에 익숙해지기, 2) 빅데이터 다루기 가 주된 목표라고 할 수 있겠다.
5주차의 강의로, 빡세게 들은 후 머신러닝 기초 강의까지 이번 방학~9월 초/중순까지 들어보는 것이 목표쓰.
-
1주차 강의는 파이썬과 웹, 크롤링의 기초 강의로 사실 웹개발 종합반에서 들었던 내용과 거의 똑같..
대신, 1주차에서 얻은 몇 가지 정보를 공유한다 (●'◡'●)
-
1. 오픈 데이터 사이트, kaggle
https://www.kaggle.com/datasets
Find Open Datasets and Machine Learning Projects | Kaggle
Download Open Datasets on 1000s of Projects + Share Projects on One Platform. Explore Popular Topics Like Government, Sports, Medicine, Fintech, Food, More. Flexible Data Ingestion.
www.kaggle.com
데이터분석을 조금이라도 해본 사람들은 다 느끼겠지만, 좋은 결과값을 위해서는 분석 스킬이나 방법론도 중요하지만
'데이터 수집'이 어쩌면... 조금 더 중요할지도 모른다.
왜냐하면 좋은 데이터나, 실습용 데이터를 쉽게 얻기가 쉽지 않기 때문...!
수업 초반에 kaggle이라는 사이트를 알려주셨는데 깜짝 놀랐음 (⊙o⊙) 머 이런 좋은 사이트가 다 있다냐...
신기한 데이터도 많고 유용한 데이터도 꽤 많은 것 같다. 연구논문에 (가능하다면) 이용할 수도 있을테지만, 대부분은 데이터 분석 실습용으로 사용하는 것 같다.
2. jupyter 설치
사실 데이터분석 종합반에서는 jupyter를 이용하지 않는다. google에서 나온 Colab을 이용하는데...
Colab에 대한 정의는 이렇게 하셨다.
앞으로의 강의에서는 구글에서 제공하는 Colab(코랩)이라는 개발 환경을 사용합니다. Colab은 인터넷과 구글 ID만 있다면 따로 개발 환경을 위한 셋팅을 하지 않고도 언제든 파이썬을 사용할 수 있게 해줍니다. 🙂
조금 살펴보니 인터페이스가 jupyter과 유사한 것 같았다? 그래서 나는 그냥 jupyter를 사용해보기로 했다.
내가 앞으로 실제적으로 코드를 짜거나 개발을 할 때 colab보다는 jupyter를 이용할 경우가 많을 것 같아서 익숙해지는 겸 하여서 jupyter를 사용하기로 하였고, 1주차 강의를 따라가보니 전혀 무리가 없었다.
jupyter notebook을 이용하기 위해서는 아나콘다를 설치하면 된다.
[파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법
오늘은 파이썬 아나콘다를 설치하는 방법을 알아보겠습니다. 파이썬은 공식 홈페이지인 python.org에서 무료로 다운로드할 수 있지만 업무 자동화, 데이터 분석 등과 같은 일을 하기 위해서는 많
hogni.tistory.com
[파이썬] 주피터 노트북(jupyter notebook) 사용법
1. 주피터 노트북 창 띄우기 작업을 저장할 폴더를 열고 경로 창을 클릭해서 jupyter notebook을 입력합니다. - 주피터 노트북을 실행하기 위해서는 아나콘다가 설치되어있어야 합니다. 설치 방법은
hogni.tistory.com
아나콘다, 주피터 설치 및 실행법은 위 블로그들을 참고했다.
2주차 정도부터 내가 원하는 공부를 할 수 있을 것 같다. 열심히 달려봐야징 ~
'Development > Data mining' 카테고리의 다른 글
전국 행정동별 행정코드, 중심좌표, 행정시설좌표 합본 (0) | 2024.01.11 |
---|---|
머신러닝 : 텍스트 벡터화 (0) | 2022.08.02 |