본문 바로가기

Python53

python 판다스(pandas) DataFrame columns 열 작업 DataFrame columns 작업 열 인덱스 및 레이블 가져오기 idx = df.columns label = df.columns[0] # 첫번째 컬럼 l = df.columns.tolist() a = df.columns.values 열 레이블 변경 df = df.rename(columns={'old':'new','a':'1'}) df.columns = ['new1', 'new2', 'new3'] 열 선택 s = df['colName'] # select col to Series df = df[['colName']] # select col to df df = df[['a','b']] # select 2-plus cols df = df[['c','a','b']] # change col order s = d.. 2023. 10. 21.
python 판다스(pandas) DataFrame 구조 통계 확인하기 전체 DataFrame 구조/통계 파악하기 1. DataFrame 내용/구조 살펴보기 df.info() # index & data types dfh = df.head(k) # first k rows dft = df.tail(k) # last k rows dfs = df.describe() # summary stats cols top_left_corner_df = df.iloc[:4, :4] 2. DataFrame 비인덱싱 속성 df = df.T # rows and cols 전환 l = df.axes # row and col indexes 확인 (r_idx, c_idx) = df.axes # 위에서 부터 s = df.dtypes # Series column data types b = df.empty # e.. 2023. 10. 21.
python 판다스(pandas) DataFrame 만들기 CSV 가져오기 데이터를 DataFrame으로 만들기 data -> DataFrame 1. 빈 DataFrame 인스턴스화 df = DataFrame() 2. CSV 파일에서 DataFrame 만들기 df = pd.read_csv('file.csv') # 주로 사용 df = pd.read_csv('file.csv', header=0, index_col=0, quotechar='"', sep=':', na_values = ['na', '-', '.', '']) 3. 인라인 CSV 텍스트에서 DataFrame으로 데이터 가져오기 from io import StringIO data = """, Animal, Cuteness, Desirable row-1, dog, 8.7, True row-2, cat, 9.5, True ro.. 2023. 10. 21.
Rosalind - Consensus and Profile 문제 설명: consensus sequence,공통서열 이란 DNA, RNA 및 단백질의 일차 구조 상에서 특정 기능에 연관된 영역에 공통적으로 존재하는 염기나 아미노산 서열을 의미합니다. DNA와 RNA 의 경우에는 프로모터나 각종 잔사 조절 인자와 같은 특정 단백질의 결합 부위를 의미 하기에 공통서열을 파악하는 것이 중요합니다. 문제 해결: 1. 주어진 서열 간에 염기 빈도를 파악합니다. 2. 최빈값을 가진, 염기서열 간 같은 위치에서 최빈값을 가진 염기를 선별합니다. 코드: ### Consensus and Profile f = open('rosalind_cons.txt', 'r') strings = [] for DNA in f.readlines(): strings.append(DNA.rstrip().. 2023. 10. 15.
반응형