whycomputer.com >> Datornätverk >  >> Smarta enheter

Hur man konverterar en TXT -fil till FASTA

Kliniska studier utförs för att analysera proteinsekvensdata och hitta behandlingar för sjukdomar. Proteinsekvensdata sätts i FASTA (fast-all) -format så att program förstår hur datasekvensen ska behandlas. FASTA -formatet har upp till 80 tecken per sekvensdatarad och använder kodstandarden IUB/IUPAC (International Union of Biochemistry/International Union of Pure and Applied Chemistry). Att konvertera en TXT-fil (ren text) till FASTA-format innebär att du redigerar eller lägger till FASTA-formaterade sekvensdata till en befintlig textfil med proteinsekvensdatarader. Textredigeringsprogram som Anteckningar gör det enkelt att göra.

Öppna proteinsekvensens textfil som du vill redigera i ett textredigeringsprogram som Anteckningar.

Redigera eller lägg till beskrivningsraden för att följa FASTA -formatet. Till exempel,> gi | 129295 | sp | P01013 | OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATERAD) är en giltig FASTA-beskrivningsrad. Denna rad ger en unik beskrivning för de sekvensdatarader som följer. FASTA -formatet kräver användning av symbolen större än (>) så att programmet kan identifiera den unika beskrivande informationen och undvika att behandla beskrivningen som en proteindatasekvensrad.

Tryck på "Enter" -tangenten för att infoga en radbrytning när beskrivningsraden har redigerats.

Redigera eller lägg till dataradsformatet för proteinsekvens för att överensstämma med IUB/IUPAC -standardkoderna. IUB/IUPAC -standarden använder bokstäverna i alfabetet för att representera acceptabla koder eller frågesekvenser för aminosyror eller nukleinsyror i FASTA -format. Till exempel, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE representerar en rad med giltiga sekvensdata eftersom den börjar med bokstaven "Q, "som representerar glutamin, och slutar med bokstaven "E, "som representerar glutamat.

Lägg till fler sekvensdatarader, redigera befintliga sekvensdatarader eller lägg till radbrytningar efter 80 tecken efter behov. Att följa FASTA -sekvensens datalinjestandarder och radbrytningar säkerställer att programmet följer instruktionerna relaterade till glutamin, glutamat och andra bokstavskoder. Bokstäverna i IUB/IUPAC -standarden är helt enkelt instruktioner till det program som behandlar FASTA -formaterade data.

Klicka på "Arkiv, "välj" Spara "och klicka sedan på" Spara ". Din TXT -fil är nu i FASTA -format.


URL:https://sv.whycomputer.com/smarta-enheter/1014018057.html

Smarta enheter
  • Hur man konverterar CPP -fil till EXE

    En .cpp är ett filtillägg som används för C ++ - källfiler. En fil med filtillägget .cpp innehåller programmeringskoden C ++. En .exe -fil är ett sammanställt filtillägg som Windows kan köra eller köra. Det finns situationer där du måste konvertera din .cpp -fil till ett .exe -program för att köra d

  • Hur man konverterar en VOD till en Mpeg

    VOD -filer finns vanligtvis på video -DVD och VCD, men de är nästan omöjliga att redigera eller visa utan programvara som är speciellt utformad för deras format. Kodningen som krävs för att formatera VOD -filer till MPG -filer, dock, är ofta svår och komplex till sin natur. Lyckligtvis, Det finns pr

  • Hur man konverterar WAV till CD -format

    Även om de håller hög kvalitet i ljudfiler, WAV -filer kan inte överföras eller läsas av CD -skivor. För att bränna dem på en CD, du måste först konvertera dem till en fil som lätt kan läsas av en CD. MP3 -filer anses sannolikt vara det mest populära filformatet för CD -skivor. Även om de inte inneh

Datornätverk © https://sv.whycomputer.com