Macbook проблемы с кириллицей. Кривые файлы txt. Или как настроить кодировку на Mac. UPD: Замечательное дополнение от нашего читателя

Скорее всего многим пользователям Mac приходилось работать с файлами txt. Чаще всего в этом формате представлены различные мануалы, readme, инструкции и т.д. И если эти документы были созданы в Windows среде, то при открытии их на Mac, может возникнуть небольшая, но в тоже время крайне неприятная проблема с кодировкой.

Давайте вместе разберёмся как научить Mac на 100% распознавать txt файл созданный на «Винде».

Дело в том, что операционные системы Apple и Microsoft руководствуется разными стандартами при кодировании кириллицы, отсюда и проблемы с её отображением. Существуют специальные утилиты призванные подружить кодировку Windows с Mac OS X, но предлагаю обойтись штатными средствами.

Решение проблемы

Исходную кодировку на Mac нужно сменить на Windows Cyrillic . Для этого находим в домашней папке скрытый файл .CFUsertextEncoding .

Для отображения скрытых файлов необходимо зайти в Терминал (программы > утилиты) и ввести команду (можете скопировать).

Defaults write com.apple.finder AppleShowAllFiles -bool true

Killall Finder

и опять enter .
Для того чтобы опять сделать файлы скрытыми, нужно заменить в первой команде true на false , а затем опять перезапустить Finder.

Итак, кликаем по этому файлу правой кнопкой и в подразделе «открыть в программе» выбираем TextEdit . В документе присутствует только одна строка, в которой нужно значение 0x7 заменить на 0x502 . После чего сохраняем файл, перезагружаем Mac и радуемся.

Если помогла статья, не ленись. Нажми кнопку — поделись!)

На подобную тему, касающийся программного пакета iWork ’09. Пару дней назад я из любопытства установил для пробы новенький Microsoft Office 2011 для Mac, а уже через несколько минут столкнулся с неправильным отображением шрифтов в некоторых текстовых полях. В том числе, и textarea браузера, являющегося для меня одним из основных рабочих инструментов во время написания статей для Маковода. Сегодня я расскажу, в чем заключалась суть и как от неё избавиться.

Начав писать двойную статью про мнения разработчиков о , я заметил, что как-то неправильно и непривычно выглядит семейство шрифтов Georgia, использующееся создателями WordPress для отображения текста в визуальном редакторе (TinyMCE) административной части этой бесплатной CMS. Приглядевшись повнимательней и детально изучив структуру страницы при помощи webkit’овского Веб-инспектора, пришел к выводу, что изменилась высота кириллических символов - они уменьшились!

В качестве примера я взял русскую и латинскую букву «е», имеющую одинаковое начертание и сделал увеличенную выноску. Впрочем, даже без увеличения прекрасно видно, что русские слова выглядят мельче:

Локализовать и устранить данное недоразумение удалось исключительно эмпирическим путем, потому что в интернете найти решение проблемы сразу не получилось, а потом доступ к глобальной сети был оборван зависшим на некоторое время сетевым коммутатором (за что снова огромное спасибо моему провайдеру).

Подобная несправедливость по отношению к русским буквам заключалась в нескольких копиях одного и того же шрифта, который вместе с Word, Excel и прочими «подарками» из Microsoft мне заботливо установил инсталлятор .

Наверное, вы уже в курсе, что у системы для пущей безопасности существует 4 шрифтовых хранилища вместо одного общего, о чем подробней можно прочитать в . Только вот лазить по папкам и удалять вручную все дубликаты нет смысла, раз в Mac OS X предусмотрена специальная утилита для управления шрифтами.

Заходим в приложение Шрифты.app (быстрее всего это можно сделать через Spotlight) и видим желтый треугольник, свидетельствующий о проблеме, описание и даже полезный совет по её решению.

К сожалению, в подсказке не указали месторасположение команды «Устранить дубликаты». Это не страшно - она прячется в меню «Правка» и за один клик позволяет гарантированно отключить все присутствующие в системе дубликаты, пометив их серым цветом в списке.

Откровенно говоря, я точно не знаю, на каком этапе применяются изменения в системе, но мне было достаточно перезапустить Google Chrome и снова наслаждаться одинаковым размером кириллических и латинских букв.

Надеюсь, что такой простой, но эффективный совет поможет и вам!

UPD: Замечательное дополнение от нашего читателя

Спасибо, что подняли эту тему, так как после установки офиса, не все маководы замечают эту проблему, так и живут с кривыми шрифтами.

Но есть еще одна проблема, касается самого офиса. Сам он не учитывает настройки в системе, какие шрифты активные, какие нет, а принудительно использует свои, из каталога /Library/Fonts/Microsoft . В итоге, русского текста в документах либо не будет, либо также будет отображаться другим шрифтом.

Поэтому, лучше всего решить эти проблемы на раз, удалением всех офисных дубликатов, которые не поддерживают русский язык. Вот список дубликатов, без русского и пары устарелых версий, из каталога /Library/Fonts/Microsoft:

  • Andale Mono
  • Arial Black
  • Arial Narrow
  • Arial Rounded Bold
  • Comic Sans MS
  • Georgia
  • Impact
  • Tahoma
  • Trebuchet MS

Можно воспользоваться (). Выполнять необходимо через sudo.

Если вы хотите увидеть на нашем сайте ответы на интересующие вас вопросы обо всём, что связано с техникой Apple, операционной системой Mac OS X (и её запуском на PC), пишите нам через или .

К нам поступил следующий вопрос:

недавно купил себе iMac, я новичок в мире Маков, так что извините за глупый вопрос. всё замечательно, но жутко раздражает, что MacOS не умеет нормально открывать текстовые файлы на русском. всегда какие-то закорюки показывает. как это можно исправить? или в какой-то другой программе открывать надо?

Этот вопрос, пожалуй, нужно включать в инструкцию к каждому новому Маку, продаваемому в России. Действительно, то ли по недосмотру, то ли от лени разработчиков Mac OS X встроенный в систему текстовый редактор TextEdit не умеет работать с русскими кодировками текста. Из-за этого все текстовый файлы txt, созданные или отредактированные в Windows, на Маках выглядят совершенно нечитаемыми.

К счастью, проблема поправима — достаточно лишь заглянуть в настройки TextEdit. Зайдите на вторую их вкладку, которая называется «Открытие и сохранение» :

Нас интересует выпадающий список «Открытие файлов». Как видите, по умолчанию здесь выбран пункт «Автоматически» , и зря. Более того, если посмотреть на содержимое списка, там вы не увидите Windows-кодировок вообще. Но это не значит, что их туда нельзя добавить. В выпадающем списке выберите самый нижний пункт — «Настроить список кодировок» . Откроется ещё одно окошко:

Пометьте в нём галочками пункты «Кириллическая (Windows)» и «Кириллическая (KOI8-R)» . Можно заодно выбрать и все остальные русские и кириллические кодировки. После этого есть шанс, что TextEdit заработает нормально. Если нет, то в уже упомянутом списке «Открытие файлов» вместо «Автоматически» выберите «Кириллическая (Windows)» . Тогда проблемы с русскими текстами точно исчезнут.

Я нашел кодировку WINDOWS-1252 наименее расстраивающей при работе с Excel. Так как его собственный собственный набор персонажей, основанный на Microsoft, можно предположить, что он будет работать как на Mac, так и на Windows-версии MS-Excel. Обе версии, по крайней мере, включают в себя соответствующий селектор "File origin" или "File encoding", который правильно считывает данные.

В зависимости от вашей системы и используемых вами инструментов эта кодировка также может быть названа CP1252 , ANSI , Windows (ANSI) , MS-ANSI или просто Windows среди других вариантов.

Эта кодировка представляет собой надмножество ISO-8859-1 (aka LATIN1 и другие), поэтому вы можете вернуться к ISO-8859-1 , если по какой-то причине вы не можете использовать WINDOWS-1252 . Имейте в виду, что ISO-8859-1 отсутствует некоторые символы из WINDOWS-1252 , как показано ниже:

| Char | ANSI | Unicode | ANSI Hex | Unicode Hex | HTML entity | Unicode Name | Unicode Range | | € | 128 | 8364 | 0x80 | U+20AC | € | euro sign | Currency Symbols | | ‚ | 130 | 8218 | 0x82 | U+201A | ‚ | single low-9 quotation mark | General Punctuation | | ƒ | 131 | 402 | 0x83 | U+0192 | ƒ | Latin small letter f with hook | Latin Extended-B | | „ | 132 | 8222 | 0x84 | U+201E | „ | double low-9 quotation mark | General Punctuation | | … | 133 | 8230 | 0x85 | U+2026 | … | horizontal ellipsis | General Punctuation | | † | 134 | 8224 | 0x86 | U+2020 | † | dagger | General Punctuation | | ‡ | 135 | 8225 | 0x87 | U+2021 | ‡ | double dagger | General Punctuation | | ˆ | 136 | 710 | 0x88 | U+02C6 | ˆ | modifier letter circumflex accent | Spacing Modifier Letters | | ‰ | 137 | 8240 | 0x89 | U+2030 | ‰ | per mille sign | General Punctuation | | Š | 138 | 352 | 0x8A | U+0160 | Š | Latin capital letter S with caron | Latin Extended-A | | ‹ | 139 | 8249 | 0x8B | U+2039 | ‹ | single left-pointing angle quotation mark | General Punctuation | | Œ | 140 | 338 | 0x8C | U+0152 | Œ | Latin capital ligature OE | Latin Extended-A | | Ž | 142 | 381 | 0x8E | U+017D | | Latin capital letter Z with caron | Latin Extended-A | | ‘ | 145 | 8216 | 0x91 | U+2018 | ‘ | left single quotation mark | General Punctuation | | ’ | 146 | 8217 | 0x92 | U+2019 | ’ | right single quotation mark | General Punctuation | | " | 147 | 8220 | 0x93 | U+201C | “ | left double quotation mark | General Punctuation | | " | 148 | 8221 | 0x94 | U+201D | ” | right double quotation mark | General Punctuation | | | 149 | 8226 | 0x95 | U+2022 | . | bullet | General Punctuation | | – | 150 | 8211 | 0x96 | U+2013 | - | en dash | General Punctuation | | - | 151 | 8212 | 0x97 | U+2014 | — | em dash | General Punctuation | | ˜ | 152 | 732 | 0x98 | U+02DC | ˜ | small tilde | Spacing Modifier Letters | | ™ | 153 | 8482 | 0x99 | U+2122 | ™ | trade mark sign | Letterlike Symbols | | š | 154 | 353 | 0x9A | U+0161 | š | Latin small letter s with caron | Latin Extended-A | | › | 155 | 8250 | 0x9B | U+203A | › | single right-pointing angle quotation mark | General Punctuation | | œ | 156 | 339 | 0x9C | U+0153 | œ | Latin small ligature oe | Latin Extended-A | | ž | 158 | 382 | 0x9E | U+017E | | Latin small letter z with caron | Latin Extended-A | | Ÿ | 159 | 376 | 0x9F | U+0178 | Ÿ | Latin capital letter Y with diaeresis | Latin Extended-A |

Обратите внимание, что знак евро отсутствует . Эту таблицу можно найти в Алан Вуд .

Конверсия

Конверсия выполняется по-разному в каждом инструменте и языке. Однако предположим, что у вас есть файл query_result.csv , который, как вы знаете, закодирован UTF-8 . Преобразуйте его в WINDOWS-1252 с помощью iconv:

Iconv -f UTF-8 -t WINDOWS-1252 query_result.csv > query_result-win.csv

В продолжение темы:
D-link

Большинство уже имело дело со штрих-кодами или, как их по-другому называют, QR-кодами. Небольшая кучка полосок на белом фоне, которые для обычного человека ничего не значат. А...

Новые статьи
/
Популярные