Python Library 55

[Pandas - Python] Replacing Values - replace() (값 변경)

Replacing Values - replace() data = pd.Series([1., -999., 2., -999., -1000., 3.]) data 0 1.0 1 -999.0 2 2.0 3 -999.0 4 -1000.0 5 3.0 dtype: float64 data.replace(-999, np.nan) 0 1.0 1 NaN 2 2.0 3 NaN 4 -1000.0 5 3.0 dtype: float64 간단하게 -999 값을 NaN 값으로 바꿨습니다. data.replace([-999, -1000], np.nan) 0 1.0 1 NaN 2 2.0 3 NaN 4 NaN 5 3.0 dtype: float64 이번에는 -999와 -1000을 NaN으로 바꿨습니다. data.replace([-999, -1..

[Pandas - Python] Transforming Data Using a Function or Mapping - map() (함수나 매핑을 이용한 데이터 변환)

Transforming Data Using a Function or Mapping - map() data = pd.DataFrame({'food': ['bacon', 'pulled pork', 'bacon', 'Pastrami', 'corned beef', 'Bacon', 'pastrami', 'honey ham', 'nova lox'], 'ounces': [4, 3, 12, 6, 7.5, 8, 3, 5, 6]}) data foodounces 0bacon4.0 1pulled pork3.0 2bacon12.0 3Pastrami6.0 4corned beef7.5 5Bacon8.0 6pastrami3.0 7honey ham5.0 8nova lox6.0 meat_to_animal = { 'bacon': 'pig..

[Pandas - Python] Removing Duplicates - drop_duplicates() (중복 제거)

Removing Duplicates - drop_duplicates() 우선 DataFrame을 하나 만들겠습니다. data = pd.DataFrame({'k1': ['one', 'two'] * 3 + ['two'], 'k2': [1, 1, 2, 3, 3, 4, 4]}) data k1k2 0one1 1two1 2one2 3two3 4one3 5two4 6two4 이때 데이터가 중복되었는지를 알기 위해선 duplicated() 함수를 이용하면 됩니다. data.duplicated() 0 False 1 False 2 False 3 False 4 False 5 False 6 True dtype: bool 중복을 제거하기 위해 drop_duplicates() 함수를 사용하겠습니다. data.drop_duplic..

[Pandas - Python] Handling Missing Data (누락된 데이터 처리)

1. Handling Missing Data - isnull() 데이터를 분석할 때, 데이터가 누락되는 것은 매우 흔한 일입니다. Pandas에서는 누락된 데이터를 처리하는 것이 간단하고, 편합니다. 우선 어떤 데이터가 누락되었는지 알려주는 isnull() 함수를 사용하겠습니다. import pandas as pd import numpy as np string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado']) string_data 0 aardvark 1 artichoke 2 NaN 3 avocado dtype: object string_data.isnull() 0 False 1 False 2 True 3 False dtype: bool 만약 ..

[오픈 소스 프로그래밍] Team Project - get_data.py

#/usr/bin/python """ 0 : 예외 남자 1 : 반팔 티셔츠, 2 : 긴팔 티셔츠, 3 : 코트, 4 : 셔츠, 5 : 블라우스(자켓), 6 : 니트(스웨터), 7 : 민소매 티셔츠(탱크톱), 8 : 패딩 1 : 청바지, 2 : 트레이닝 바지, 3 : 슬랙스, 4 : 면바지, 5 : 반바지 여자 1 : 반팔 티셔츠, 2 : 긴팔 티셔츠, 3 : 코트, 4 : 셔츠, 5 : 블라우스(자켓), 6 : 니트(스웨터), 7 : 민소매 티셔츠(탱크톱), 8 : 패딩 1 : 청바지, 2 : 트레이닝 바지, 3 : 슬랙스, 4 : 면바지, 5 : 반바지, 6 : 롱스커트, 7 : 레깅스, 8 : 미니스커트 맑음(맑), 구름(구), 흐림(흐), 비(비), 소나기(소), 눈(눈) """ import sys..

[오픈 소스 프로그래밍] Team Project - insert_data.py

#!/usr/bin/python # DataBase를 구축하는 코드 # 0 : 예외 # 남자 # 1 : 반팔 티셔츠, 2 : 긴팔 티셔츠, 3 : 코트, 4 : 셔츠, 5 : 블라우스(자켓), 6 : 니트(스웨터), 7 : 민소매 티셔츠(탱크톱), 8 : 패딩 # 1 : 청바지, 2 : 트레이닝 바지, 3 : 슬랙스, 4 : 면바지, 5 : 반바지 # t1_m : 남자 상의 반팔 티셔츠 # b1_m : 남자 하의 청바지 # 여자 # 1 : 반팔 티셔츠, 2 : 긴팔 티셔츠, 3 : 코트, 4 : 셔츠, 5 : 블라우스(자켓), 6 : 니트(스웨터), 7 : 민소매 티셔츠(탱크톱), 8 : 패딩 # 1 : 청바지, 2 : 트레이닝 바지, 3 : 슬랙스, 4 : 면바지, 5 : 반바지, 6 : 롱스커트, 7..

[오픈 소스 프로그래밍] Team Project - main.py

#!/usr/bin/python import get_data """ 0 : 예외 남자 1 : 반팔 티셔츠, 2 : 긴팔 티셔츠, 3 : 코트, 4 : 셔츠, 5 : 블라우스(자켓), 6 : 니트(스웨터), 7 : 민소매 티셔츠(탱크톱), 8 : 패딩 1 : 청바지, 2 : 트레이닝 바지, 3 : 슬랙스, 4 : 면바지, 5 : 반바지 여자 1 : 반팔 티셔츠, 2 : 긴팔 티셔츠, 3 : 코트, 4 : 셔츠, 5 : 블라우스(자켓), 6 : 니트(스웨터), 7 : 민소매 티셔츠(탱크톱), 8 : 패딩 1 : 청바지, 2 : 트레이닝 바지, 3 : 슬랙스, 4 : 면바지, 5 : 반바지, 6 : 롱스커트, 7 : 레깅스, 8 : 미니스커트 맑음(맑), 구름(구), 흐림(흐), 비(비), 소나기(소), 눈(..

[오픈 소스 프로그래밍] Team Project - data.json

{ "man_top" : [ {"id": "1", "name": "short t shirt", "url_1": "https://postfiles.pstatic.net/MjAyMjA1MjdfNTMg/MDAxNjUzNjE1MTkzNTgx.RShqOSBRn1GzO9RznJGw3c2HXpf_An9IJKKUhTZ3mccg.fhIxXNXm7YCgW0o7wMfkuL_AL_rC-8YI_JcXgxq3tVEg.JPEG.ksunbum97/%EB%82%A8%EC%9E%90_%EB%B0%98%ED%8C%94_1.jpg?type=w966", "url_2": "https://postfiles.pstatic.net/MjAyMjA1MjdfMjky/MDAxNjUzNjE1MTkzNTc4.eid2LiBFh44BWlSh2ZnLqnCuSnQl..

[오픈 소스 프로그래밍] Git

OSS의 관리를 위해 개발자는 수천 명이 있고, 수십 만개의 파일, 그리고 다른 시차에서 전 세계로 퍼져있는 사람들이 있습니다. 심지어 다양한 프로세서를 사용하고, 이전의 버전들이 필요하기도 합니다. 이러한 관리를 vcs를 통해서 합니다. vcs는 code base를 관리합니다. 이때 code base는 코드, 문서, 빌드 tool, 설정 파일 등을 모두 포함합니다. 1. VCS (version control system) VCS는 아래와 같은 점들을 도와줍니다. 소스코드의 변경을 관리 수정의 흔적을 보관함 필요하다면 이전 버전으로 Roll back 팀이 동시에 작업할 수 있게 해줌 테스트 및 배포 프로세스를 자동화 해줌 Benefits 이식성 Branching and mergin Manual mergi..

[오픈 소스 프로그래밍] 쉘 스크립트 (Shell Script)

Shell은 Unix/Linux를 위한 명령어 인터프리터입니다. 번역을 위한 과정이 없으며, unix/linux 시스템과 소통하기위한 인터페이스입니다. 또한 명령어, 프로그램, shell script를 실행할 수 있는 환경입니다. Shell Prompt는 Shell 명령어를 입력할 수 있는 창이며 '$'로 시작합니다. Shell Script는 텍스트 파일안에 있는 정렬된 명령어의 리스트이며, shell environment에 의해 실행됩니다. 명령어는 Shell 변수, 제어 문구 등을 넣을 수 있습니다. 참고로 알아야할 부분들이 있는데, 확장자는 .sh입니다. 그리고 파일의 맨 앞에 #!/bin/bash를 써야합니다. 그래야 시스템에 shell script를 쓴다는 사실을 알려주고, bash shell로..