У некоторых людей случаются проблемы с кодировкой на сайте/сервере из-за чего вместо русского текста появляются иероглифы вида:
Одной из причин происхождения является тот факт, что у вас установлены разные кодировки вывода данных (текста) в PHP / MySQL / Html / Файлах. По правде... Это единственная причина по которой у вас иероглифы.. Осталось разобраться только откуда именно поступает неправильная кодировка. Например, может быть что в PHP, Html, Файлах кодировка UTF-8, а в MySQL win-1251 и из-за этого у вас проблемы.
Что ж для того что бы решить проблему не мороча себе голову выставьте везде кодировку UTF-8.
1 . Файл сайта должен быть сохранён в UTF-8.
2. В HTML между тэгами
и добавьте строку:http-equiv ="content-type " content ="text/html; charset=utf-8 " />
3. В PHP файле перед вывод каких-либо HTML частей, вставьте строку:
header("Content-Type: text/html; charset=utf-8");
Можно сию строку поставить и в начале файла.
4. И конечно MySQL... Тут дело затяжней.
Нередко бывают случаи когда все данные отображаются правильно, по русски короме тех которые хранятся и выводятся на страницу из базы данных MySQL, в этом случае это естественно проблемы только БД и предыдущие 3 шага выполнять необязательно.
Т.к я не знаю вашей ситуации то предположу:
4.1. У вас в MySQL все данные записываются в неверной кодировке.
Для того что бы убедиться в этом или обратном воспользуйтесь PhpMyAdmin и собственноручно проверьте базу. Если в ней записи в отличном "русском" состоянии, значит с кодировкой данных в базе всё нормально и остаётся только неправильная кодировка вывода данных из MySQL. Если же действительно в базе билиберда и полно иероглифов, то сделайте следующее:
В PhpMyAdmin выберите используемую БД, затем справа выберите вкладку "Операции", и в самом низу "Сравнение" Поставьте utf8_general_ci .
4.2 . У вас неправильная кодировка вывода данных из MySQL .
В том случае если у вас в базе всё по русски а вот выводит данные она иероглифани, значит проблемы именно с выводом. Для решения этой проблемы, убедитесь что перед выводом чего-либо из базы в PHP файле присутствуют такие строки:
mysql_query("SET NAMES utf8");
mysql_query("SET CHARACTER SET utf8");
mysql_query("SET COLLATION_CONNECTION="utf8_general_ci"");
Китайская письменность – иероглифическая. Встречаются иероглифы и в других языках, испытавших влияние Китая – японском и, в меньшей степени, корейском. Во вьетнамском языке иероглифическая письменность использовалась до XX века. Перед изучающими эти языки особенно остро стоит вопрос, сколько нужно знать иероглифов, как их запомнить и, главное, не забыть.
Иероглиф в классическом письменном языке вэньянь 文言 означал, как правило, целое слово. В современном китайском языке слова большей частью состоят из одного-двух, реже трех и более иероглифов. Поэтому иероглифов существует очень много.
В 1994 году был издан словарь «Море китайских иероглифов» Чжунхуа цзыхай 中華字海, в котором насчитывается 85568 иероглифов! Правда, подавляющую их часть можно встретить лишь несколько раз в классических литературных произведениях. Обычные двуязычные словари насчитывают около 6-8 тысяч иероглифов, среди которых также попадается немало редких. Более полные толковые словари насчитывают около 10-20 тысячи знаков.
Считается, что для понимания 80% современного обычного китайского текста достаточно знать 500 наиболее частотных иероглифов, знание 1000 иероглифов дает понимание примерно 91% текста, а 2500 иероглифов – 99% текста. Для того, чтобы сдать экзамен для иностранцев на знание китайского языка высшего уровня HSK 6, нужно знать чуть меньше 3000 иероглифов. Для чтения специальной научной или классической литературы нужно понимать большее количество иероглифов.
Однако надо иметь ввиду, что даже если все иероглифы в тексте вам знакомы, вы далеко не всегда абсолютно точно поймете смысл написанного. Нужно знать еще и слова — различные словосочетания иероглифов. В китайском языке используется довольно много сокращений, когда устойчивые словосочетания из нескольких иероглифов сокращаются до более коротких.
Так, например, словосочетание «Пекинский университет» 北京大学 Běijīng dàxué сокращается до 北大 Běidà , что буквально означает «северный большой». Другая сложность китайского языка — это использование чэнъюй 成语 — идиом, состоящих, как правило, из четырех иероглифов. При буквальном переводе каждого из знаков смысл сказанного может оказаться непонятым. Существуют специальные словари чэнюев, а также сборники рассказов, где поясняется смысл наиболее известных идиом. Переводы чэнъюй можно найти и в словарях.
В японском языке существует обязательный список иероглифов Дзёё кандзи 常用漢字, принятый Министерством образования Японии в качестве достаточного в повседневном употреблении. Он состоит из 2136 кандзи (иероглифов) и включает 1006 кёику кандзи , которые изучают школьники в 6-летней начальной школе и 1130 кандзи , которые учат в средней школе.
На первый взгляд, иероглиф кажется хаотичным набором различных черт и точек. Однако это не так. Существует несколько базовых элементов, из которых состоит иероглиф. Прежде всего, это черты, из которых состоят графемы. Графемы, в свою очередь, формируют более сложный знак.
Любой иероглиф состоит из определенного набора черт. Сами по себе черты не имеют лексического значения и чтения. Всего существует четыре типа черт и более двух десятков их разновидностей:
Встречаются и немного другие классификации черт, однако общей сути это не меняет. Черты в иероглифы пишутся в строго определенной последовательности: «сначала горизонтальная, потом вертикальная, сначала откидная влево, потом откидная вправо, сначала верхняя, затем нижняя, сначала слева, затем справа, сначала в середине, потом с двух сторон от неё, сначала входим внутрь, затем затворяем дверь» .
В прошлом иероглифы состояли из большого числа черт, запомнить их было непросто. Поэтому одной из целей реформы письменности, осуществленной китайским правительством в 60-х годах XX века, было упрощение иероглифов путем уменьшения количества черт.
Аналогичное упрощение иероглифов было осуществлено и в Японии. Однако упрощенные японские иероглифы не всегда соответствуют китайским, хотя зная полные и упрощенные варианты китайских иероглифов, обычно легко понять и японские упрощенные. Например, слово «библиотека», записанное китайским упрощенным письмом: 图书馆, китайским полным письмом: 圖書館 и на японском языке: 図書館. На китайском языке оно читается túshūguǎn , на японском — toshokan .
На Тайване, в Сингапуре и некоторых других местах по-прежнему пользуется полный вариант написания иероглифов. Да и в материковом Китае можно встретить тексты, записанные полными иероглифами. Кроме того, до сегодняшнего дня сохранились иероглифы, насчитывающие несколько десятков черт. Как правило, они редко употребляются и потому не были упрощены.
Наиболее сложным для написания считается иероглиф biáng (бян ), который состоит из более чем 60 черт. Он означает вид лапши, популярный в провинции Шэньси. За пределами региона этот иероглиф практически не используется, и потому он отсутствует в словарях и в компьютерных шрифтах.
Иероглиф «бян» считается самым сложным для написания. Рассказывают, что студенты одного из институтов в Чэнду систематически опаздывали на занятия. И профессор, разозлившись на них, велел каждому написать иероглиф «бян» тысячу раз. Сделать это смогли не все. И все слезно просили прощения, обещая впредь не опаздывать на занятия.
Из черт формируются графемы – простые иероглифические знаки, обладающие устойчивыми лексическими значениями. Это базовые знаки китайской иероглифической письменности, из которых состоят китайские иероглифы. Они являются наиболее древними и выражают основные элементы окружающего мира и человека.
Примеры графем: человек 人 rén , женщина 女 nǚ , ребенок 子 zǐ , солнце 日 rì , небо 天 tiān , земля (почва) 土 tǔ и т.д.
Всего насчитывается около 300 графем, относительно их точного числа ученые-лингвисты расходятся в оценках. Большинство графем используются в современной китайской письменности в качестве наиболее употребительных знаков. Графемы составляют около 10% от числа наиболее употребительных иероглифов.
Помимо графем существуют ключи . Ключи – это основные классификационные знаки. Стандартный список ключей насчитывает 214 знаков. В него входят многие графемы и некоторые черты, не имеющие фиксированного значения. Таким образом, не все графемы являются ключами и не все ключи являются графемами.
Долгое время список из 214 ключей составлял так называемый иероглифический индекс, в соответствии с которым были упорядочены иероглифы в китайских словарях. Однако после того, как в КНР была введена упрощенная иероглифическая письменность, некоторые знаки подверглись либо частичному упрощению, либо структурным изменениям.
Для изучающих языки с иероглифической письменностью знание таблицы ключей является обязательным.
Большинство иероглифов состоят из двух или более графем. Традиционно их делят на две большие группы: идеографические знаки и фоноидеографические знаки.
Идеографические знаки
Идеографические знаки (идеограммы) состоят из двух и более графем. В них значение иероглифа является производным от семантики входящих в него графем, но чтение иероглифа никак не связано с ними. В современном китайском языке доля идеографических знаков составляет около 10%.
Примеры идеограмм:
Фоноидеографические знаки
Около 80% иероглифов составляют так называемые фоноидеографические знаки, или фоноидеограммы. Иероглифы такого типа обычно состоят из двух частей. Одна часть называется семантическим множителем , или иероглифическим ключом . Она указывает на принадлежность иероглифа к определенной группе семантически родственных знаков и тем самым подсказывает приблизительное значение.
Другая часть иероглифа называется фонетиком и подсказывает приблизительное чтение. После реформы китайской письменности значительно возросло число фоноидеограмм, состоящих из двух графем, что значительно облегчило запоминание иероглифов.
Примеры фоноидеограмм:
Однако в процессе развития чтение многих иероглифов изменилось и в настоящее время далеко не всегда можно догадаться даже о приблизительном чтении иероглифа. Тем более, если речь идет о .
Думаю, вы убедились, что иероглиф имеет четкую структуру, в нем не может быть случайных элементов. Это помогает довольно легко запомнить написание и значение иероглифов.
Графемы восходят к пиктограммам, представляя собой видоизмененные, предельно упрощенные и абстрактные рисунки. В интернете можно найти немало картинок, показывающих, как постепенно изображение становилось все более отвлеченным и абстрактным. Это помогает быстрому запоминанию.
Наиболее древние иероглифы, от которых произошли современные, датируются серединой II тыс. до н.э. Это иньские гадательные надписи на костях животных и панцирях черепах. Постепенно изображения становились все более абстрактными, пока не приобрели современное написание
Когда я только начинала изучение китайского языка в университете, мы сперва изучили список из 214 ключей. Их я прописывала помногу раз, стараясь писать красиво, запомнить правильный порядок черт, который строго фиксирован. На это не стоит жалеть времени.
Изучив ключи, нетрудно запомнить сложные знаки – идеограммы и фоноидеограммы. Можно придумать историю, которая позволит навсегда запомнить полные иероглифы с большим количеством черт.
Примеры запоминания:
Главное, дать волю фантазии. Со временем это войдет в привычку и для запоминания иероглифа достаточно будет просто запомнить названия графем, входящих в его состав.
А вот пример запоминания полного написания иероглифа «любовь» 愛 ài . Если разбить его на составные элементы, добавить немного шутки, то получится такая фраза: «когти в сердце вонзились, ножки подкосились, тут и крышка настала».
Или вот как можно запомнить иероглиф 腻 nì . Его словарные значения – «сало, грязь, лоснящийся, глянцевый, гладкий». Он состоит из графем «луна» (очень похожая на неё – «мясо»), «раковина», «стрелять из лука» и «два». Можно придумать историю: человек подстрелил из лука дичь (лоснящееся мясо, жирное, блестящее, с большим количеством сала), и продал её за две раковины (в древности – деньги) японцу. Как раз по-японски «два» читается как ни .
Чем более смешная, нелепая получится история, тем легче вы запомните иероглифы.
Кроме того, очень часто подобный разбор иероглифов помогает глубже прояснить смысл сложнейших и многозначных категорий китайской философии и культуры. На своих лекциях по китайской философии я часто прибегаю к такому способу объяснения.
И это далеко не все значения! Однако если разбить иероглиф на входящие в него графемы, то все значения станут интуитивно понятны. Первая графема – 首 shǒu , «голова, макушка, начало, главное, основное, суть». Вторая – «продвигаться вперед». То есть Дао – нечто основное, что продвигается вперед, находится в движении.
Или, другой пример, важнейшая 仁 rén — человеколюбие, гуманность . Иероглиф состоит из двух графем: человек 人 rén и два 二 èr . И читается так же как «человек». То есть человеколюбие – это отношения между людьми, которые строятся на основе справедливости. Как говорил , «Только обладающий человеколюбием может любить людей и ненавидеть людей» («Лунь юй», IV, 3).
Одно из любимых занятий китайцев — писать иероглифы кистью, смоченной водой. Причем здесь иероглифы вдобавок написаны в зеркальном отображении!
Хотя в китайском языке большинство иероглифов относится к категории фоноидеограмм, тем не менее, иероглиф не содержит прямого указания на чтение, как фонетические языки. Еще одна трудность китайского языка заключается в широком распространении явления омофонии: из-за ограниченного количества слогов (немногим более 400), разные иероглифы могут читаться одинаково, что создает определенные трудности в понимании устной речи. Тем не менее, очень удобно запоминать целый ряд иероглифов, имеющих одинаковое чтение.
На первых порах своего изучения китайского языка тон я обычно запоминала по какой-нибудь черте: горизонтальная черта в верхней части иероглифа означала первый тон, наклонная влево — второй тон, горизонтальная внизу — третий тон, наклонная или откидная вправо — четвертый тон. Хотя встречались иероглифы, где нужной черты не находилось.
Совершенно иная ситуация складывается в японском языке, где существует два вида чтения иероглифов: онное , пришедшее из китайского языка, и кунное , традиционное японское. Таким образом, один иероглиф может иметь до 5 и более различных чтений! В разных словосочетаниях иероглифы могут читаться по-разному.
Например, в японском языке слова «вчера» 昨日 и «завтра» 明日, имеющие в своем составе одинаковый знак 日 (день, солнце), читаются абсолютно по-разному: kino: и ashita соответственно. В словосочетании «каждый день», «ежедневно» 毎日 будет читаться mainichi , «третье число», «три дня» 三日- mikka . Хотя, по идее, все четыре слова должны были бы оканчиваться одинаково.
Именно поэтому единственный действенный способ и в китайском, и в японском языке запомнить чтение иероглифов — это зубрежка : многократно проговаривать их про себя и вслух, пытаться запомнить мелодику. В китайском языке это сделать, на мой взгляд, проще в силу наличия фоноидеограмм и общей повторяемости слогов, в японском — чуть сложнее.
Для тех, кто владеет китайским языком, японский язык со стороны кажется проще, по крайней мере, в части иероглифики. Действительно, значительная часть иероглифов в японском языке пишется одинаково с китайскими или очень похоже. Особенно, если знаешь полный вариант написания китайских иероглифов. Однако, как всегда, дьявол кроется в деталях. Расскажу о том, что я обнаружила уже на первых порах своего изучения японского языка.
Что делать, если текст на вашем компьютере или в вашем браузере отображается в виде сочетания непонятных символов, говоря простым языком - иероглифов? Решаем проблему в данной статье.
Сначала давайте уясним одну деталь... Речь идёт не об японских или прочих иероглифах, а о тех непонятных сочетаниях букв, цифр и знаков, которые появляются вместо текста. Иероглифы (так мы будем их условно называть) примерно будут выглядеть таким образом, как изображено на картинке ниже.
Если вы попробуете открыть какую-нибудь библиотеку или файл (например, с расширениями.dll, .exe) в блокноте, то вам покажут именно такие иероглифы. Но это не значит, что ваш компьютер неисправен. Просто некоторые файлы нужно открывать именно в соответствующих редакторах. Т.е. если вы попытаетесь открыть pdf книгу в блокноте, то получите иероглифы вместо текста. Отсюда следует первое правило: Открывайте и редактируйте текст только в подходящих для этого программах!
Однако бывает и так, что абсолютно весь текст на вашем компьютере отображается неправильно. Это может быть связано с тем, что вирус повредил какие-нибудь файлы, либо всё обстоит достаточно безобидно (установили себе какую-нибудь кривую программу, или что-то криво обновилось, или что-то криво русифицировалось). В таком случае не нужно паниковать и бить себя пяткой в грудь. Для решения проблемы достаточно просто настроить компьютер.
Для настройки нам необходимо найти в «Панели управления» утилиту «Язык и региональные стандарты».
В Windows XP это делается таким образом: Пуск – Настройка – Панель управления – Дата, время, язык и региональные стандарты – Язык и региональные стандарты.
В Windows 7 всё чуть попроще: Пуск – Панель управления – Язык и региональные стандарты.
Запустив данную утилиту, вам нужно будет проставить во всех вкладках «Русский язык» как основной.
Если вы проставили все значения (или они уже у вас стояли), а текст продолжает отображаться неверно, тогда попробуйте восстановить систему. Восстановите систему за день (или раньше) до того дня, когда у вас появилась эта проблема. Система восстановит повреждённые системные файлы, и текст будет отображаться нормально.
Бывают случаи, когда текст отображается неправильно только в определённом приложении или (чаще всего) в интернет-браузере. Тогда вам нужно порыться в настройках браузера или приложения, выбрав русский язык как основной. Обычно в кодировке текста браузеров стоит пункт «по умолчанию». Если данный пункт у вас уже выбран, но проблемы всё равно возникают, то попробуйте изменить кодировку на Кириллицу. Если же ничего не помогает, то просто переустановите ваш браузер. В большинстве современных браузеров, при их переустановке, все ваши настройки и закладки сохраняются (и сохранённые пароли тоже). Поэтому можно смело переустановить браузер, не боясь потерять какие-либо данные.
Если же вышеуказанные способы всё равно не помогают, тогда попробуйте поинтересоваться у друзей или знакомых – быть может, они сталкивались уже с подобной проблемой. Или же поищите информацию на различных форумах и сайтах. В общем, кто ищет – тот всегда найдёт. В отличие от большинства неполадок, проблемы с шрифтом могут иметь множество первопричин.
Вышеописанные способы являются основными, а потому, я надеюсь, они помогут вам.
Последние статьи раздела «Компьютеры & Интернет»:
Какую компьютерную мышь выбрать
Мониторинг и профилактика компьютера
Одноразовая почта
Что такое IP-адрес и для чего он нужен
Вопрос пользователя
Здравствуйте.
Подскажите пожалуйста, почему у меня некоторые странички в браузере отображают вместо текста иероглифы, квадратики и не пойми что (ничего нельзя прочесть). Раньше такого не было.
Заранее спасибо...
Доброго времени суток!
Действительно, иногда при открытии какой-нибудь интернет-странички вместо текста показываются различные "крякозабры" (как я их называю), и прочитать это нереально.
Происходит это из-за того, что текст на страничке написан в одной кодировке (более подробно об этом можете узнать из ), а браузер пытается его открыть в другой. Из-за такого рассогласования, вместо текста - непонятный набор символов.
Попробуем исправить это...
Браузер
Вообще, раньше Internet Explorer часто выдавал подобные крякозабры, современные же браузеры (Chrome, Яндекс-браузер, Opera, Firefox) - довольно неплохо определяет кодировку, и ошибаются очень редко. Скажу даже больше, в некоторых версиях браузера уже убрали выбор кодировки, и для "ручной" настройки этого параметра нужно скачивать дополнения, или лезть в дебри настроек за 10-ток галочек...
И так, предположим браузер неправильно определили кодировку и вы увидели следующее (как на скрине ниже)...
Чаще всего путаница бывает между кодировками UTF (Юникод) и Windows-1251 (большинство русскоязычных сайтов выполнены в этих кодировках).
Еще один совет : если в браузере не можете найти, как сменить кодировку (а дать инструкцию для каждого браузера - вообще нереально!), я рекомендую попробовать открыть страничку в другом браузере. Очень часто другая программа открывает страницу так, как нужно.
Текстовые документы
Очень много вопросов по крякозабрам задаются при открытии каких-нибудь текстовых документов. Особенно старых, например при чтении Readme в какой-нибудь программе прошлого века (например, к играм).
Разумеется, что многие современные блокноты просто не могут прочитать DOS"овскую кодировку, которая использовалась ранее. Чтобы решить сию проблему, рекомендую использовать редактор Bread 3.
Bred 3
Простой и удобный текстовый блокнот. Незаменимая вещь, когда нужно работать со старыми текстовыми файлами. Bred 3 за один клик мышкой позволяет менять кодировку и делать не читаемый текст читаемым! Поддерживает кроме текстовых файлов довольно большое разнообразие документов. В общем, рекомендую!
Попробуйте открыть в Bred 3 свой текстовый документ (с которым наблюдаются проблемы). Пример показан у меня на скрине ниже.
Для работы с текстовыми файлами различных кодировок так же подойдет еще один блокнот - Notepad++. Вообще, конечно, он больше подходит для программирования, т.к. поддерживает различные подсветки, для более удобного чтения кода.
Пример смены кодировки показан ниже: чтобы прочитать текст, достаточно в примере ниже, достаточно было сменить кодировку ANSI на UTF-8.
WORD"овские документы
Очень часто проблема с крякозабрами в Word связана с тем, что путают два формата Doc и Docx . Дело в том, что с 2007 Word (если не ошибаюсь) появился формат Docx (позволяет более сильнее сжимать документ, чем Doc, да и надежнее защищает его).
Так вот, если у вас старый Word, который не поддерживает этот формат - то вы, при открытии документа в Docx, увидите иероглифы и ничего более.
Решения есть 2:
Так же при открытии любого документа в Word (в кодировке которого он "сомневается"), он на выбор предлагает вам самостоятельно указать оную. Пример показан на рисунке ниже, попробуйте выбрать:
Окна в различных приложениях Windows
Бывает такое, что какое-нибудь окно или меню в программе показывается с иероглифами (разумеется, прочитать что-то или разобрать - нереально).
Языки и региональные стандарты в Windows
Чтобы открыть меню настроек:
intl.cpl - язык и регион. стандарты
Проверьте чтобы во вкладке "Форматы" стояло "Русский (Россия) // Использовать язык интерфейса Windows (рекомендуется)" (пример на скрине ниже).
Во вкладке местоположение поставьте расположение Россия.
И во вкладке дополнительно установите язык системы на "Русский (Россия)". После этого сохраните настройки и перезагрузите ПК. Затем вновь проверьте, нормально ли отображается интерфейс нужной программы.
И напоследок, наверное, для многих это очевидно, и все же некоторые открывают определенные файлы в программах, которые не предназначены для этого: к примеру в обычном блокноте пытаются прочитать файл DOCX или PDF. Естественно, в этом случае вы вместо текста будут наблюдать за крякозабрами, используйте те программы, которые предназначены для данного типа файла (WORD 2007+ и Adobe Reader для примера выше).
На сим всё, удачи!