0x92 є зазвичай розумна цитата в
кодування. Це недійсний символ UTF-8, тому csv відмовляється аналізувати його. Якщо ви використовуєте python3, можете спробувати відкрити файл із таким кодуванням: за допомогою open("/Users/kiya/sep_sent.csv", "r", encoding="cp1252") як f: для рядка у f: print (line.strip())3 жовтня 2018 р
Кодова точка 0x92 (146 десяткових) є права одинарна лапка або апостроф (') у Windows-1252. Це недійсний символ у ISO 8859 і UTF-8, оскільки діапазон 0x80-0x9F зарезервовано для керуючих символів C1. Замініть символ відповідним апострофом Unicode (U+2019) або екрануйте його як ’ .
Процесори Intel® Core™ У стандартному наборі POST-кодів AMI код POST 0x92 означає, що Розпочато ініціалізацію шини PCI.
Різниця між Unicode та UTF-8 Unicode — це набір символів. Він перетворює символи в числа. UTf-8 є стандартом кодування. Він переводить числа в двійкову.
UTF-8 — це стандарт кодування символів змінної довжини, який використовується для електронний зв'язок. Назва, визначена стандартом Unicode, походить від формату перетворення Unicode – 8-біт.
Ось символи ASCII 0x20 (простір) до 0x7E (тильда).