본문 바로가기

Python16

[Numpy]넘파이란? 넘파이란? Numpy는 Numerical Python의 줄임말로, 파이썬에서 산술 계산을 위한 패키지이다. 과학 계산을 위한 대부분의 패키지는 Numpy의 배열 객체를 데이터 교환을 위한 공통 언어처럼 사용한다. Numpy ndarray Numpy의 N차원의 배열 객체이다. 형태가 파이썬의 리스트와 비슷하다고 생각할 수 있으나 기본적으로 메모리 공간을 차지하는 형태가 다르다. 리스트의 경우 하나의 리스트 안에 다른 타입(숫자, 문자 등)이 공존이 가능하지만 넘파이는 동일한 타입의 데이터만 들어갈 수 있다. Numpy 와 List의 차이점 1. print 문 출력 형태 두 자료형의 차이는 출력을 해보면 간단하게 확인이 가능하다. # L:List , A:Array L = [1, 2, 3] A = np.arr.. 2022. 8. 24.
CSV 파일 형식이란? CSV 는 'Comma-Seperated Values'의 약자로서 파일 내 데이터의 값의 구분자를 콤마(,)로 하는 파일 형식이다. 데이터처리를 하다보면 open API에서 제공되는 일반적인 파일 형식임을 알 수 있다. 따로 관련 파일을 여는 프로그램은 없고 더블클릭을 하게 되면 엑셀 형태로 열리게 된다. 정말 그럴 일은 없겠지만 만약, 엑셀이 없더라도 메모장으로 열 수 있다. 기존 엑셀 형식의 파일을 csv파일로 변환도 가능한데 저장시에 파일 형식을 지정할 때 CSV UTF-8(쉼표로 분리)를 선택하면 된다. 주의할 점은 엑셀은 다중 시트를 사용할 수 있으나 csv는 그렇지 않다는 점! 2022. 8. 10.
파이썬과 아나콘다 설치하기 파이썬(Python)은 1990년 암스테르담의 귀도 반 로섬(Guido Van Rossum)이 개발한 인터프리터 언어이다. 이름을 어디서 따왔고 사전적 의미 같은 이야기는 굳이 중요한 것은 아니라고 생각하니 생략을 하고.. 나는 그냥 간단하게 데이터 분석시 가장 많이 사용되는 도구 라고 하고 싶다. 그럼 아나콘다는 뭐야? 파이썬을 사용하다보면 매번 라이브러리를 받아서 써야하는데 이러한 번거로움을 줄여준다. 파이썬은 언어 그 자체이기때문에 이러한 코드를 관리할 때 사용하는 것이 바로 주피터 노트북이다. 파이썬은 쉽고 가장 범용적으로 사용되긴 하지만 현업에서는 파이토치를 많이 쓰고 있다고 한다. 아래의 홈페이지를 통해서 윈도우 자체에 파이썬을 설치할 수 있다. 파이썬 공식 홈페이지의 다운로드 페이지(http.. 2022. 8. 10.
판다스 자료구조 - 시리즈 시리즈는 데이터가 순차적으로 나열된 1차원 배열의 형태를 갖는다. 보통 인덱스(index)와 데이터 값(value)의 일대일 대응이라고 표현하며 인덱스의 경우 자기 자신과 짝을 이루는 데이터 값의 순서와 위치를 저장한다. 이러한 특징때문에 비슷한 구조의 딕셔너리(dictionary)를 시리즈로 변환하여 사용한다. 딕셔너리를 시리즈로 # pandas 불러오기 import pandas as pd # {key:value} 형태로 딕셔너리를 만들고 새로운 변수에 저장 dic_data = {'L':1, 'O':2, 'V':3, 'E':4} # pandas 내장함수인 Series()를 이용하여 딕셔너리를 시리즈로 변환, 또 다른 변수에 저장 new_data = pd.Series(dic_data) # 결과보기 typ.. 2022. 8. 9.