Формат GenBank (плоский формат файлу GenBank) складається з розділу анотації та розділу послідовності. Початок розділу анотації позначається лінією, яка починається зі слова «LOCUS».
Плоска база даних — це база даних, яка зберігається у файлі, який називається плоским файлом. Записи мають єдиний формат, і немає структур для індексування чи розпізнавання зв’язків між записами. Файл простий. Плоский файл може бути звичайним текстовим файлом (наприклад, csv, txt або tsv) або двійковим файлом.
Що таке плоский формат у біоінформатиці? Плоский формат файлу таблиця з одним записом на рядок. FASTA та інші формати файлів є прикладом плоского формату файлу в біоінформатиці.
Формат плоского файлу GenBank (. gb або . gbk) є широко використовуваний формат файлу, який дозволяє зберігати послідовності нуклеїнових кислот або білків разом із їх анотаціями. Її не слід плутати з базою даних генетичних послідовностей NIH під назвою GenBank (https://www.ncbi.nlm.nih.gov/genbank/).
Файл векторної послідовності у форматі .gb (GenBank): ТЕКСТОВИЙ документ з інформацією про послідовність, який можна переглянути за допомогою текстового редактора (наприклад, Notepad, Text Edit) або програмного забезпечення для аналізу послідовності (наприклад, SnapGene, Vector NTI)
Одним із найпоширеніших плоских файлів є файл із значеннями, розділеними комами (CSV).. Файли CSV – це файли, у яких дані таблиці зібрані в рядки тексту американського стандартного коду для обміну інформацією (ASCII), у якому значення кожної клітинки таблиці відокремлено комою, а кожен рядок представлено новим рядком.