Ниже представлена информация о местоположении 3 последовательностей: название последовательности, начальный и конечный сайты. Я хотел бы обратиться к точному местоположению сайтов. Например, значение 785 на самом деле означает, что начальный сайт начинает отсчет с местоположения 27860291 и заканчивается 789, что на самом деле равно 27861079. Может кто-нибудь помочь мне?
Код
from Bio import SeqIO
from collections import defaultdict
output_file = open('B.bed','w')
with open('A.bed') as f:
for line in f:
name, start, stop = line.split()
start = int((name.split(':')[1].split('-')[0]))+line.index(start)
stop = start + len(stop)
# print short_sequence_record.id, start, stop
output_line ='%s\t%i\t%i\n' % \
((line.split(':')[0]),start,stop)
output_file.write(output_line )
output_file.close()
A.кровать
chr1:27860291-27862300 785 789
chr1:27860291-27862300 1539 1543
chr1:15504072-15506081 675 679
Вывод
chr1 15504096 15504099
Ожидаемый результат
chr1 27861075 27861079
chr1 27861829 27861833
chr1 15504746 15504750