Биоинформатика


Пример использования функции чтения данных из файла в FASTA формате



Download 13,15 Mb.
bet18/25
Sana14.07.2022
Hajmi13,15 Mb.
#800049
TuriПротокол
1   ...   14   15   16   17   18   19   20   21   ...   25
Bog'liq
Биоинформатика методичка

Пример использования функции чтения данных из файла в FASTA формате

    1. Перед загрузкой данных в рабочую среду Matlab биологические последовательности, полученные из баз банных или других источников, сохраняют в файле с расширением fasta в отдельной рабочей директории. Совет. Для выполнения этого действия откройте программу «Блокнот» и вставьте свою последовательность в FASTA формате. Описание этого формата было приведено выше. Дайте имя файлу в соответствии с ACCESSION number вашей последовательности. Когда даете расширение при сохранении в «Типе файла» выберете «все файлы».

Используя функцию fastaread можно прочитать и загрузить эти данных для дальнейшего использования в программе Matlab .
s= fastaread('NC_010658.fasta');
В рабочей области видим формирование бинарного массива данных
s =
Header: [1x127 char]
Sequence: [1x1741 char]



    1. Если у вас не очень много файлов и они не большие по размеру, то лучше сохранить их всех в одном файле с расширением .fa. Для создание такого исходного файла так же откройте программу «Блокнот» и вставьте свои последовательности в FASTA формате. Используя функцию fastaread можно прочитать и загрузить эти данных для дальнейшего использования в программе Matlab .

seqs = fastaread('pf01.fa');
В рабочей области видим формирование массива данных
seqs =
8x1 struct array with fields:
Header
Sequence



    1. При наличии версии Matalb старше 8-ой, возможна загрузка данных непосредственно их базы данных, при наличии подключенного Интернета.Например, получение набора данных из GenBank. В данном случае использованы внутренние номера базы данных, соответствующие нуклеотидным последовательностям D-петли, изолированной из различных видов.

% Species Description GenBank Accession
data = {'German_Neanderthal' 'AF011222';
'Russian_Neanderthal' 'AF254446';
'European_Human' 'X90314' ;
'Mountain_Gorilla_Rwanda' 'AF089820';
'Chimp_Troglodytes' 'AF176766';
'Puti_Orangutan' 'AF451972';
'Jari_Orangutan' 'AF451964';
'Western_Lowland_Gorilla' 'AY079510';
'Eastern_Lowland_Gorilla' 'AF050738';
'Chimp_Schweinfurthii' 'AF176722';
'Chimp_Vellerosus' 'AF315498';
'Chimp_Verus' 'AF176731';
};
for ind = 1:length(data)
primates(ind).Header = data{ind,1};
primates(ind).Sequence = getgenbank(data{ind,2},'sequenceonly','true');
end



  1. Download 13,15 Mb.

    Do'stlaringiz bilan baham:
1   ...   14   15   16   17   18   19   20   21   ...   25




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish