Публикации по теме 'utf-8'


Кодировка символов: ASCII, Unicode, UTF-8.
Представьте себе сценарий, в котором Боб хочет отправить сообщение Алисе, но их компьютеры используют разные методы для представления букв. Компьютер Боба использует цифру 1 для обозначения буквы «А», а компьютер Алисы — цифру 2. Это несоответствие означает, что если Боб отправит Алисе сообщение «Привет, Алиса!», Компьютер Алисы не сможет его понять. Решение этой проблемы заключается в использовании стандарта кодировки символов. Стандарт кодировки символов — это способ представления букв,..

Вопросы по теме 'utf-8'

Искатель PHP - проблема с сайтами с разными кодировками
Я создаю анализатор плотности ключевых слов. Я создал анализатор ключевых слов, который отлично работает с веб-сайтами с английским содержанием и кодировкой UTF-8. Когда я сканирую веб-сайт, например myegy.com, ключевые слова на арабском языке...
651 просмотров
schedule 24.04.2024

Ruby 1.8 Iconv UTF-16 в UTF-8 завершается с ошибкой \000 (Iconv::InvalidCharacter)
У меня возникают проблемы с обработкой текстовых файлов табличных данных, сгенерированных на компьютере с Windows. Я работаю в Руби 1.8. Следующее выдает ошибку ("\000" (Iconv::InvalidCharacter)) при обработке ВТОРОЙ строки из файла. Первая строка...
2519 просмотров
schedule 11.05.2024

Почему Eclipse использует кодировку Cp1252?
Извините, если это очень дилетантский вопрос! Я знаю, что Eclipse использует кодировку Cp1252 по умолчанию. Недавно я создал программу, использующую хэш-карты для преобразования вводимых букв в шрифт Брайля. Для этого мне пришлось изменить метод...
46833 просмотров
schedule 07.05.2024

Неправильный макет при записи данных SAS в .txt с кодировкой UTF-8
Я могу экспортировать наборы данных SAS в текстовые файлы с кодировкой UTF-8. Но я увидел, что формат полностью изменился, когда я преобразовал в текст с кодировкой UTF-8. Программа, которую я использовал: %do i=1 %to &num_file; data _null_...
629 просмотров
schedule 19.03.2024

Обнаружить кодировку в PHP без многобайтового расширения?
Есть ли способ определить кодировку строки в PHP без загрузки расширения mbstring? Я знаю, что это можно сделать с помощью mb_detect_encoding() , но есть ли эквивалентная немногобайтовая функция? Если нет, то что нужно для реализации функции...
427 просмотров
schedule 16.04.2024

Как перегрузить компаратор для сортировки с UTF-8 и разными локалями
У меня есть набор данных: ["Alphabet","Zend","Ćwiczenia"] в результате collection.sort получаю: ["Alphabet","Zend","Ćwiczenia"] . Как перегрузить comparator для сортировки с использованием UTF-8 и других языков?
235 просмотров
schedule 02.04.2024

Почему пустая строка '' закодирована в 2 байта в utf-16, но 0 байтов в utf-8 или ascii?
Я только что узнал о кодировании строк в python и, немного повозившись с этим, меня смутил тот факт, что размер пустой строки ('') равен 0 в utf 8 и ascii, но почему-то 2 в utf 16? почему? print(len(''.encode('utf16'))) # is 2...
606 просмотров
schedule 28.04.2024

Как открыть файл, имя которого содержит код Unicode в Lisp (sbcl+slime)?
(with-open-file (s "~/例子.txt" :external-format :utf-8) (print s)) результат: NIL c-string encoding error: the character with code 20363 cannot be encoded. [Condition of type SB-INT:C-STRING-ENCODING-ERROR] Пример:...
139 просмотров
schedule 12.05.2024