본문 바로가기

Python53

Rosalind - Counting DNA Nucleotides 33 위 정도 였던거 같은데 한 동안 못했더니 39 위로 내려가 있네요. 복습도 할 겸 문제 풀때 사용했던 코드를 하나씩 공유하고자 합니다. 궁금한 점은 댓글로 남겨 주시면 감사하겠습니다. Rosalind - Counting DNA Nucleotides 문제 풀이 def count_bases 함수 선언 replace() 로 문자열에 줄내림 치환 for문을 통해서 freq 변수에 A, C, G, T 가 있으면 +1 씩 세어서 저장 코드 1: def count_bases(filename): file = open(filename, 'r') string = file.read().replace('\n', '') freq = {'A': 0, 'C': 0, 'G': 0, 'T': 0} for i in string: .. 2023. 9. 9.
Python programming for Bioinformatics - 연습문제 6 파이썬으로 실무에 적용 가능할 법한 bioinformatics 연습문제를 만들어서 풀어보겠습니다. input 데이터를 사용해서 output 형태로 만들면 성공입니다. 두 문제로 이루어져 있습니다. INPUT 1 : NC_004459.data INPUT 2 : NC_004459.fasta 1.문제 설명 : 1)INPUT1 파일의 CDS 에서 ‘/locus_tag’ 이름이 존재하는 것만 위치 정보를 기억하여 INPUT2 파일의 sequence 를 가져온다. 단, 위에서 차례대로 10개의 sequence 를 갖고 fasta파일 만든다. Complement 는 무시하고 위치 정보만을 이용한다. sequence 는 70개씩 잘라서 써주며, ID 옆에는 해당 sequence의 length를 써준다. 2. 결과 파일.. 2023. 7. 24.
Python programming for Bioinformatics - 연습문제 5 파이썬으로 실무에 적용 가능할 법한 bioinformatics 연습문제를 만들어서 풀어보겠습니다. input 데이터를 사용해서 output 형태로 만들면 성공입니다. INPUT : corNerve.txt 1.파일 설명 : 1)이 파일은 값을 중심으로 N*N matrix 이다. 2)첫 번째 행 : gene name list (순서를 나타냄.) 3)두 번째 행부터의 첫 번째 열: gene name 4)두 번째 행부터의 두 번째 열부터 끝 열까지 : 해당 gene과 다른 gene과의 correlation value 값이다. OUTPUT 1.문제 설명 : 1) Correlation 값이 0.9 이상이면 gene name을 파일에 써준다. 2. 결과 파일: •1번째 필드 : 해당 행의 gene name , 2번째.. 2023. 7. 24.
Python programming for Bioinformatics - 연습문제 4 파이썬으로 실무에 적용 가능할 법한 bioinformatics 연습문제를 만들어서 풀어보겠습니다. input 데이터를 사용해서 output 형태로 만들면 성공입니다. INPUT : SSGI_GO_TC_process.data 1.파일 설명 : 1)1번째 필드 : GO, 2번째 필드 : TC list, 3번째 필드 : TC 개수 2. 문제 설명 : 1) GO 대 TC 리스트를 TC에 대한 GO 리스트로 바꿔서 결과 파일을 만든다. OUTPUT 2. 결과 파일: • 1번째 필드 : TC, 2번째 필드 : GO list, 3번째 필드 : GO 개수 • 각 필드는 tab으로 구분한다. • 2번째 GO 리스트는 중간에 콤마로 연결시켜준다. (INPUT 파일과는 조금 다름. 처음에는 콤마 안 들어감.) => 결과는 .. 2023. 7. 24.
300x250