빅데이터

    Pandas 라이브러리

    Pandas Python Data Analysis 데이터 분석 및 조작을 위한 파이썬 라이브러리 대용량의 데이터들을 처리하는데 매우 편리 R에서 사용되던 data frame 구조를 본뜬 DataFrame이라는 구조를 사용 Pandas 자료구조 Series: 1차원 DataFrame: 2차원 Panel: 3차원 Pandas 라이브러리 불러오기 pandas는 주로 pd라는 약칭으로 사용된다. import pandas as pd Pandas Series Series 생성 series = pd.Series([1.0, 2.0, 3.0, 4.0, 5.0, 6.0]) series 0 1.0 1 2.0 2 3.0 3 4.0 4 5.0 5 6.0 dtype: float64 pandas 라이브러리의 Series 메서드로 ..

    Numpy 라이브러리

    Numpy Numerical Python 수학 및 과학 연산을 위한 파이썬 패키지 Numpy 내부는 상당부분이 C나 Fortran으로 작성되어 있어 실행 속도가 꽤 빠른 편이다. 기본적으로 array라는 자료를 생성하고, 이를 바탕으로 색인, 처리, 연산 등을 하는 기능을 수행한다. Numpy 자체만으로도 난수생성, 푸리에변환, 행렬연산, 간단한 기술통계 분석 정도는 가능하지만 실제로는 Scipy, Pandas, matplotlib 등 다른 Python 패키지와 함께 쓰이는 경우가 많다. Numpy Data Types Numpy Type C Type Description numpy.bool_ bool Boolean (True or False) stored as a byte numpy.byte signed..