본문 바로가기

Python53

DataFrame 에서 엑셀 파일을 가져올 때 선행 0을 유지하는 방법 DataFrame 에서 엑셀 파일을 가져올 때 선행 0을 유지하는 방법 방법 1. dtype을 사용하여 문자열로 저장하기import pandas as pd# DataFrame 생성 시 dtype을 문자열로 지정data = {'Column1': ['001', '002', '003'], 'Column2': [10, 20, 30]}df = pd.DataFrame(data, dtype=str)# DataFrame을 Excel로 저장df.to_excel('output.xlsx', index=False) 방법 2. xlsxwriter 사용하여 형식 지정import pandas as pd# 예제 DataFramedata = {'Column1': ['001', '002', '003'], 'Column2': [10, 2.. 2024. 7. 16.
CSV 파일을 가져올 때 선행 0을 유지하는 방법 CSV 파일을 가져올 때 선행 0을 유지하는 방법 방법  : DataFrame을 CSV 파일로 저장할 때 데이터의 leading zero(선행 0)를 유지하는 방법은 열의 데이터를 문자열로 변환하는 것import pandas as pd# 예제 DataFrame 생성data = {'Column1': ['001', '002', '003'], 'Column2': [10, 20, 30]}df = pd.DataFrame(data)# 모든 열을 문자열로 변환df = df.astype(str)# DataFrame을 CSV로 저장df.to_csv('output.csv', index=False)  특정 열만 문자열로 변환 특정 열만 문자열로 변환하여 선행 0을 유지하려는 경우:import pandas as pd# 예제.. 2024. 7. 16.
VCF 파일에서 missing allele 분석하는 방법 VCF 파일에서 missing allele 분석하는 방법 VCF 파일에서는 missing allele이 . 또는 ./. 등의 형식으로 표시됩니다.이 정보를 추출하여 분석하는 방법을 단계별로 설명하겠습니다.  1. VCF 파일 읽기 및 데이터프레임 생성 import pandas as pdimport glob# VCF 파일 경로vcf_file = 'path/to/your/file.vcf'# VCF 파일 읽기 함수def read_vcf(file): with open(file, 'r') as f: lines = f.readlines() header_line = [line for line in lines if line.startswith('#') and not line.startswith(.. 2024. 7. 14.
Multiple VCF 파일을 하나의 DataFrame 으로 합치기 Multiple VCF 파일을  하나의 DataFrame 으로 합치기 import pandas as pdimport glob# VCF 파일들이 저장된 디렉토리 경로vcf_dir = 'path/to/vcf/files/'# VCF 파일 목록 가져오기vcf_files = glob.glob(vcf_dir + '*.vcf')# VCF 파일 읽기 함수def read_vcf(file): with open(file, 'r') as f: lines = f.readlines() header_line = [line for line in lines if line.startswith('#') and not line.startswith('##')][0] header = header_line.strip.. 2024. 7. 14.
반응형