Python Library 55

[오픈소스 프로그래밍] Unix, Linux에 대한 소개

Linux에 대해 알기 전에 Unix OS에 대해 먼저 알아야 합니다. Unix의 특징으로는 다양한 종류의 시스템 사이에서 서로 이식할 수 있음 다중 사용자 및 다중 작업을 지원 Unix 시스템의 개념으로는 일반 텍스트 파일 명령줄 인터프리터 계층적인 파일 시스템 (트리 구조) 장치 및 특정한 형식의 프로세스 간 통신을 파일로 취급 -> 통일을 시킴으로써 개발하기 좋음 초기의 Unix는 서버에 쓰는 OS였습니다. 이러한 유닉스는 아래와 같은 형태로 발전되어 왔습니다. 이처럼 유닉스는 처음에는 서버 같은 중형 컴퓨터에 사용하도록 고안이 되었으며, 여러 가지 유틸리티가 공개되면서 일반 사용자들에게 확산되었습니다. 다중 사용자, 다중 작업이 가능하고 프로그램 개발이 쉬운 운영체제인 덕분에 대부분의 통신 서비스..

[오픈 소스 프로그래밍] OSS (Open Source Software)

1. 오픈 소스란? 일반적인 정의 : 누구나 쉽게 배포할 수 있고, 변형할 수 있는 소스코드가 있는 소프트웨어 이때 소스코드는 저작권 소유자가 사용자에게 권한을 부여하는 라이선스를 통해 연구, 변형, 배포를 할 수 있습니다. 즉, 누구도 오픈 소스에 대한 독점적인 권한을 가질 수 없고, 특허나 저작권을 얻을 수 없습니다. 1.1 Free Software OSS는 free software과 유사하며, 더 넓은 의미의 free and open-source software입니다. 이때 Free software는 다음과 같은 특징을 가지고 있습니다. 소프트웨어에 대한 실행, 복제, 배포, 연구, 변형, 성능 향상이 자유 어떤 목적이든 프로그램을 실행할 수 있다. 프로그램이 어떻게 작동되는지 연구할 수 있고, 이..

[Matplotlib - Python] Matplotlib 라이브러리와 파일 저장, 텍스트 처리, 여러 데이터 처리

기본 데이터 import pandas as pd import matplotlib.pyplot as plt import matplotlib matplotlib.rcParams['font.family'] = 'Malgun Gothic' # Windows # matplotlib.rcParams['font.family'] = 'AppleGothic' # Mac matplotlib.rcParams['font.size'] = 15 matplotlib.rcParams['axes.unicode_minus'] = False x = [1, 2, 3] y = [2, 4, 8] 1. 파일 저장 plt.figure(dpi = 200) plt.plot(x,y) plt.savefig('graph.png', dpi = 100) 이렇..

[Matplotlib - Python] Matplotlib 라이브러리와 꺾은 선 그래프의 여러 설정들

기본 데이터 import matplotlib.pyplot as plt import matplotlib matplotlib.rcParams['font.family'] = 'Malgun Gothic' matplotlib.rcParams['font.size'] = 15 matplotlib.rcParams['axes.unicode_minus'] = False x = [1, 2, 3] y = [2, 4, 8] 아 참고로 title에도 따로 폰트와 size를 설정할 수 있습니다. plt.title('꺽은 선 그래프', fontdict={'family': 'HYGungSo-Bold', 'size':20}) 참고로 fontdict을 쓰지 않고도, plt.title('꺽은 선 그래프', family= 'HYGungSo-..

[Matplotlib] Matplotlib 라이브러리

1. Matplotlib 이란 Matplotlib란 다양한 형태의 그래프를 통해서 데이터를 시각화할 수 있는 라이브러리입니다. Pandas의 Series나 DataFrame도 쉽고 간단하게 표현할 수 있습니다. 다양한 설정 값을 통해서 다양한 형태의 그래프를 표현할 수 있습니다. 2. 설치 pip install matplotlib 를 해주시거나 아니면 파이참에서 따로 넣어주셔도 됩니다. 3. 기본 사용법 기본적인 사용을 위해 좌표를 먼저 설정하겠습니다. x = [1, 2, 3] y = [2, 4, 8] 를 통해서 좌표를 설정했습니다. plt.plot() 함수를 사용하면 좌표에 해당하는 꺾은선 그래프를 표현할 수 있습니다. plot() 사용 plt.plot(x,y) 참고로 주피터 노트북이 아닌 파이참 환경..

[Pandas - Python] Pandas 라이브러리와 그룹화

기본 데이터 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 이름학교키국어영어수학과학사회SW특기 지원번호 1번채치수북산고19790851009585Python 2번정대만북산고1844035505525Java 3번송태섭북산고1688075708075Javascript 4번서태웅북산고1874060707580NaN 5번강백호북산고1881520103510NaN 6번변덕규능남고20280100958580C 7번황태산능남고1885565454035PYTHON 8번윤대협능남고19010085909595C# 1. groupby 함수 df.groupby('학교') 이렇게 '학교'를 기준으로 그룹화를 하면 밑에처럼 나옵니다. 이때, 원하시는 값에..

[Pandas - Python] Pandas 라이브러리와 함수 적용

기본 데이터 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 이름학교키국어영어수학과학사회SW특기 지원번호 1번채치수북산고19790851009585Python 2번정대만북산고1844035505525Java 3번송태섭북산고1688075708075Javascript 4번서태웅북산고1874060707580NaN 5번강백호북산고1881520103510NaN 6번변덕규능남고20280100958580C 7번황태산능남고1885565454035PYTHON 8번윤대협능남고19010085909595C# 1. apply 함수 위의 데이터의 학교 column에 + '등학교'를 붙이면 어떻게 될까요? df['학교'] += '등학교' df 이름..

[Pandas - Python] Pandas 라이브러리와 데이터 수정(Column과 Row, Cell)

기본적인 데이터 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 이름학교키국어영어수학과학사회SW특기 지원번호 1번채치수북산고19790851009585Python 2번정대만북산고1844035505525Java 3번송태섭북산고1688075708075Javascript 4번서태웅북산고1874060707580NaN 5번강백호북산고1881520103510NaN 6번변덕규능남고20280100958580C 7번황태산능남고1885565454035PYTHON 8번윤대협능남고19010085909595C# 1. Column column 수정 (replace) 학교 column에서의 북산고를 산북고로 바꿔보겠습니다. 이때 딕셔너리 형태로 ..

[Pandas - Python] Pandas 라이브러리와 결측치 및 데이터 정렬(fillna, sort_values, sort_index)

이번 시간에는 결측치 채우기 및 데이터 정렬에 대해 알아보겠습니다. 음... 사실 보간법은 아직까지 공부하질 않아서 잘 모르겠네요 .. 사실 결측치 해봤자 fillna함수를 쓰는 것 뿐입니다. 아직 초보라.. 따라서 제대로 된 보간법에 대해서 공부하시고 싶으신 분들은 다른 내용을 찾아보시는 게 좋을 것 같습니다. import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df 이름학교키국어영어수학과학사회SW특기 지원번호 1번채치수북산고19790851009585Python 2번정대만북산고1844035505525Java 3번송태섭북산고1688075708075Javascript 4번서태웅북산고1874060707580NaN 5번강백호북산고1..

[Pandas - Python] Pandas 라이브러리와 데이터 검색(조건)

저번 시간까지 기본, loc, iloc를 이용해서 데이터를 검색하는 법에 대해 공부했었습니다. 이번 시간부터는 특정한 조건에 해당하는 데이터를 검색하는 방법을 알아보겠습니다. 생각보다 어렵지 않습니다. import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') df 이름학교키국어영어수학과학사회SW특기 지원번호 1번채치수북산고19790851009585Python 2번정대만북산고1844035505525Java 3번송태섭북산고1688075708075Javascript 4번서태웅북산고1874060707580NaN 5번강백호북산고1881520103510NaN 6번변덕규능남고20280100958580C 7번황태산능남고1885565454035PYTH..