Основні етапи структурної анотації:
- Повторіть ідентифікацію та маскування.
- Вирівнювання доказів (необов’язково).
- Ідентифікація сплайсингу (тільки в еукаріотів).
- Передбачення ознак (кодують і некодують послідовності).
Анотація послідовності є процес позначення специфічних особливостей у послідовності ДНК, РНК або білка за допомогою описової інформації про структуру або функцію.
Послідовності ДНК позначаються літерами: Щоб використовувати A для аденіну, G для гуаніну, C для цитозину та T для тиміну, однак CNN не створена для обробки інформації в цьому форматі, з цієї причини вона розробила графічне представлення послідовностей.
ДНК транскрибується за допомогою ферменту РНК-полімерази. РНК-полімераза (блідо-блакитна) рухається поетапно вздовж ДНК, розкручуючи спіраль ДНК у її активному місці.
Використовуючи підходи до анотації генів, можна передбачити гени або білки, які можуть бути рекрутовані певною послідовністю геному. Функціональна анотація цих нових генів або білків може бути зроблена за допомогою пошук їх подібності з добре експериментально перевіреними послідовностями, наявними в базах даних.
Анотація геному є процес пошуку та позначення місць розташування окремих генів та інших ознак у необроблених послідовностях ДНК, які називаються збірками. Анотація надає значення певній послідовності та полегшує дослідникам перегляд і аналіз її вмісту.