Однак ви можете перевірити свій файл вручну за допомогою cat . HDFS cat: hadoop dfs -cat /шлях/до/файлу | голова щоб перевірити, чи це текстовий файл.
Таблиці Hive і Impala в HDFS можна створити за допомогою текстові файли. Файли послідовності, файли даних Avro та формати файлів Parquet. Серіалізація даних — це спосіб представлення даних у пам’яті у вигляді серії байтів. Avro — це ефективна структура серіалізації даних, яка широко підтримується в Hadoop та його екосистемі.
Перевірка типу файлу за допомогою сценарію Bash Прапорець -f перевіряє, чи існують звичайні файли (не каталоги).. Нарешті, прапорець -d перевіряє, чи є це каталог чи ні. Цей прапор не може приймати аргумент підстановки.
Відображення типу файлу (команда файлу)
- Щоб відобразити тип інформації, який містить файл із назвою myfile, введіть наступне: file myfile. …
- Щоб відобразити тип кожного файлу, названого у файлі filenames.lst, який містить список імен файлів, введіть наступне: file -f filenames.lst.
У полі пошуку на панелі завдань введіть File Explorer, а в результатах пошуку виберіть File Explorer. У Провіднику файлів у розділі Перегляд у групі Показати/сховати встановіть прапорець Розширення імені файлу.