Koi8 r windows 1251

Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для русских версий Microsoft Windows до 10-й версии. В прошлом пользовалась довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах Windows в 1990—1991 гг. совместно представителями «Параграфа», «Диалога» и российского отделения Microsoft. Первоначальный вариант кодировки сильно отличался от представленного ниже в таблице (в частности, там было значительное число «белых пятен»). Но однако был вариативным и представленным в 6 формах применения.

В современных приложениях отдается предпочтение Юникоду (UTF-8). На 1 апреля 2019 лишь на 1 % всех веб-страниц используется Windows-1251. [1]

Содержание

Особенности [ править | править код ]

Windows-1251 выгодно отличается от других 8‑битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в русской типографике для обычного текста (отсутствует только значок ударения); Она также содержит все символы для других славянских языков: украинского, белорусского, сербского, македонского и болгарского.

Windows-1251 имеет два недостатка:

  • строчная буква «я» имеет код 0xFF (255 в десятичной системе). Она является «виновницей» ряда неожиданных проблем в программах без поддержки чистого 8-го бита, а также (гораздо более частый случай) использующих этот код как служебный (в CP437 он обозначает «неразрывный пробел», в Windows-1252 — ÿ, оба варианта практически не используются; число же -1 , в дополнительном коде длиной 8 бит представляющееся числом 255 , часто используется в программировании как специальное значение).
  • отсутствуют символы псевдографики, имеющиеся в CP866 и KOI8 (хотя для самих Windows, для которых она предназначена, в них не было нужды, это делало несовместимость двух использовавшихся в них кодировок заметнее).
Читайте также:  Сколько нужно ртути чтобы убить человека

Также как недостаток может рассматриваться отдельное расположение буквы «ё», тогда как остальные символы расположены строго в алфавитном порядке. Это усложняет программы лексикографического упорядочения.

Синонимы: CP1251; ANSI (только в русскоязычной ОС Windows).

Таблицы [ править | править код ]

Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII. Числа под буквами обозначают шестнадцатеричный код подходящего символа в Юникоде.

Результат

[Результат перекодировки появится здесь. ]

Поставьте ссылку на наш сайт!
Универсальный декодер кириллицы

Custom Work
For a small fee I can help you quickly recode/recover large pieces of data — texts, databases, websites. or write custom functions you can use (invoice available).
FAQ and contact information.

О программе

Здравствуйте! Эта страница может пригодиться, если вам прислали текст (предположительно на кириллице), который отображается в виде странной комбинации загадочных символов. Программа попытается угадать кодировку, а если не получится, покажет примеры всех комбинаций кодировок, чтобы вы могли выбрать подходящую.

Использование

  • Скопируйте текст в большое текстовое поле дешифратора. Несколько первых слов будут проанализированы, поэтому желательно, чтобы в них содержалась (закодированная) кириллица.
  • Программа попытается декодировать текст и выведет результат в нижнее поле.
  • В случае удачной перекодировки вы увидите текст в кириллице, который можно при необходимости скопировать и сохранить.
  • В случае неудачной перекодировки (текст не в кириллице, состоящий из тех же или других нечитаемых символов) можно выбрать из нового выпадающего списка вариант в кириллице (если их несколько, выбирайте самый длинный). Нажав OK вы получите корректный перекодированный текст.
  • Если текст перекодирован лишь частично, попробуйте выбрать другие варианты кириллицы из выпадающего списка.

Ограничения

  • Если текст состоит из вопросительных знаков (". ?? . "), то проблема скорее всего на стороне отправителя и восстановить текст не получится. Попросите отправителя послать текст заново, желательно в формате простого текстового файла или в документе LibreOffice/OpenOffice/MSOffice.
  • Не любой текст может быть гарантированно декодирован, даже если есть вы уверены на 100%, что он написан в кириллице.
  • Анализируемый и декодированный тексты ограничены размером в 100 Кб.
  • Программа не всегда дает стопроцентную точность: при перекодировке из одной кодовой страницы в другую могут пропасть некоторые символы, такие как болгарские кавычки, реже отдельные буквы и т.п.
  • Программа проверяет максимум 7245 вариантов из двух и трех перекодировок: если имело место многократное перекодирование вроде koi8(utf(cp1251(utf))), оно не будет распознано или проверено. Обычно возможные и отображаемые верные варианты находятся между 32 и 255.
  • Если части текста закодированы в разных кодировках, программа сможет распознать только одну часть за раз.
Читайте также:  Как правильно настроить стим

Условия использования

Пожалуйста, обратите внимание на то, что данная бесплатная программа создана с надеждой, что она будет полезна, но без каких-либо явных или косвенных гарантий пригодности для любого практического использования. Вы можете пользоваться ей на свой страх и риск.

Если вы используете для перекодировки очень длинный текст, убедитесь, что имеется его резервная копия.

Переводчики

Страница подготовки переводов на другие языки находится тут.

Что нового

October 2013 : I am trying different optimizations for the system which should make the decoder run faster and handle more text. If you notice any problem, please notify me ASAP.

На английской версии страницы доступен changelog программы.

Перекодирование из одних кодировок в другие — Win1251 в KOI8-R и наоборот

Содержание материала

Перекодировка текста из Win1251 в KOI8-R и наоборот

TConvertChars = array [ #128 .. #255 ] of char;

#128 , #129 , #130 , #131 , #132 , #133 , #134 , #135 , #136 , #137 , #060 , #139 , #140 , #141 , #142 , #143 ,

#144 , #145 , #146 , #147 , #148 , #169 , #150 , #151 , #152 , #153 , #154 , #062 , #176 , #157 , #183 , #159 ,

#160 , #246 , #247 , #074 , #164 , #231 , #166 , #167 , #179 , #169 , #180 , #060 , #172 , #173 , #174 , #183 ,

#156 , #177 , #073 , #105 , #199 , #181 , #182 , #158 , #163 , #191 , #164 , #062 , #106 , #189 , #190 , #167 ,

#225 , #226 , #247 , #231 , #228 , #229 , #246 , #250 , #233 , #234 , #235 , #236 , #237 , #238 , #239 , #240 ,

#242 , #243 , #244 , #245 , #230 , #232 , #227 , #254 , #251 , #253 , #154 , #249 , #248 , #252 , #224 , #241 ,

#193 , #194 , #215 , #199 , #196 , #197 , #214 , #218 , #201 , #202 , #203 , #204 , #205 , #206 , #207 , #208 ,

#210 , #211 , #212 , #213 , #198 , #200 , #195 , #222 , #219 , #221 , #223 , #217 , #216 , #220 , #192 , #209 );

Читайте также:  Почему время не переводится автоматически на телефоне

#128 , #129 , #130 , #131 , #132 , #133 , #134 , #135 , #136 , #137 , #138 , #139 , #140 , #141 , #142 , #143 ,

#144 , #145 , #146 , #147 , #148 , #149 , #150 , #151 , #152 , #153 , #218 , #155 , #176 , #157 , #183 , #159 ,

#160 , #161 , #162 , #184 , #186 , #165 , #166 , #191 , #168 , #169 , #170 , #171 , #172 , #173 , #174 , #175 ,

#156 , #177 , #178 , #168 , #170 , #181 , #182 , #175 , #184 , #185 , #186 , #187 , #188 , #189 , #190 , #185 ,

#254 , #224 , #225 , #246 , #228 , #229 , #244 , #227 , #245 , #232 , #233 , #234 , #235 , #236 , #237 , #238 ,

#239 , #255 , #240 , #241 , #242 , #243 , #230 , #226 , #252 , #251 , #231 , #248 , #253 , #249 , #247 , #250 ,

#222 , #192 , #193 , #214 , #196 , #197 , #212 , #195 , #213 , #200 , #201 , #202 , #203 , #204 , #205 , #206 ,

#207 , #223 , #208 , #209 , #210 , #211 , #198 , #194 , #220 , #219 , #199 , #216 , #221 , #217 , #215 , #218 );

function Win_KoiConvert( const St: string ): string ;