Rosalind-1/030_SSEQ.py at master · Shivi91/Rosalind-1 · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
#!/usr/bin/env python
'''
A solution to a ROSALIND bioinformatics problem.

Problem Title: Finding a Spliced Motif
Rosalind ID: SSEQ
Rosalind #: 030
URL: http://rosalind.info/problems/sseq/
'''

from scripts import ReadFASTA

dna, sub_seq = [fasta[1] for fasta in ReadFASTA('data/rosalind_sseq.txt')]

sseq_indicies, i = [], 0
for nucleotide in sub_seq:
	# In practice: Use exception handling/additional constraints as such a subsequence does not necessarily exist.
	while dna[i] != nucleotide:
		i += 1

	# Use i+1 as the indicies because Rosalind starts at i=1 instead of i=0.
	sseq_indicies.append(str(i+1))
	i += 1

print ' '.join(sseq_indicies)
with open('output/030_SSEQ.txt', 'w') as output_data:
	output_data.write(' '.join(sseq_indicies))