Интернационализација, локализација, кодирање, Исланд и превод веб странице са фотографијама јапанских мачака
Постоји пуно информација када је реч о интернационализацији, локализацији и кодирању унутар веб апликација. Такође постоји много неспоразума око тога шта свака пружа за веб апликацију. Ево моје претпоставке ...
Када веб прегледач успостави везу са веб сервером, он прослеђује неколико променљивих и даје додатне захтеве, ево примера:
ГЕТ / ХТТП / 1.1
Водитељ: ввв.дкневмедиа.цом
Кориснички агент: Мозилла / 5.0 (Мацинтосх; У; Интел Мац ОС Кс; ен-УС; рв: 1.8.1.3) Гецко / 20070309 Фирефок / 2.0.0.3
Прихватам: ХТТП Прихватам = тект / кмл, апплицатион / кмл, апплицатион / кхтмл + кмл, тект / хтмл; к = 0.9, тект / плаин; к = 0.8, имаге / пнг, * / *; к = 0.5
Прихвати-језик: ен-ус, ен; к = 0.5
Прихвати-кодирај: гзип, дефлате
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
интернационализам
Интернационализација је комбинација многих ствари:
- Локализација: Способност препознавања са којег језика и локације посетилац долази. То се ради путем ХТТП захтева где је посетилац идентификован локалом. У мом случају, то је ен-УС. „Ен“ је енглески, а „УС“ су Сједињене Државе. Ово је поставка у мом оперативном систему.
- Временске зоне: Могућност прилагођавања временским зонама. То се обично постиже постављањем вашег сервера на средње време по Греенвицху (ГМТ), а затим дозвољавањем корисницима да поставе локални помак од ГМТ-а.
- Кодирање карактера: Ово је способност правилног приказивања скупова језика. Разликује се од локализације, јер локализација може да ми каже језик и регион рачунара са којег се захтева, али ми неће рећи са којег језика се читалац захтева ... то је на читаоцу!
Обавештење у мом ХТТП заглављу када је прегледач послао захтев, рекао је серверу да захтева моју локализацију (Аццепт-Лангуаге: ен-ус); међутим, такође треба да каже серверу који скуп знакова се тражи (Аццепт-Цхарсет: Аццепт-Цхарсет: ИСО-8859-1, утф-8; к = 0.7, *; к = 0.7) ИСО-8859-1 и утф -8 су оба дозвољена скупа знакова.
Локализација
У овом фантастичном помешаном свету локализација више никада не диктира језик. Иако се налазим у ен-УС-у, апсолутно знам да читам други језик користећи другачији скуп знакова ... то се дешава када користим Гоогле хинди (Не користим Гоогле Хинди). Мој захтев за локалитет и скуп знакова идентични су као када захтевам Гоогле енглески страницу, али заправо ме храни страница коју не могу да прочитам јер немам скуп знакова. Све се испостави ??????????? ... Међутим, тај знак могу учитати у Фирефок (Фирефок> Преференцес> Адванцед> Лангуагес):
Ако учитам тај језик, могу да затражим страницу у њеном изворном скупу знакова и прикажем је на рачунару, иако је моја подразумевана локализација ен-УС!
Па ... ако сам студент хиндског, студирам енглески језик на Пурдуеу и повезан преко ВПН на школски сервер, на одмору у Аустралији ... постоје 3 различита подешавања која треба применити на апликацију да би се заиста интернационализовала - и ниједан зависе од другог.
Мој локалитет би био ен-УС, али моја временска зона је Аустралија, али језик који захтевам са веб локације може бити хиндски. Ако бих програмирао своју пријаву претпоставке на основу локализације мог рачунара, потпуно бих погрешио - хранио особу Енглеском у источној временској зони. У идеалном случају, програмирао бих своју апликацију да нуди оба поставке језика и временске зоне ... али не бих их претпостављао на основу локалитета.
Исланд - крајњи пример
Ми нисмо упознати са вишејезичним и вишејезичним изазовима у Сједињеним Државама где смо све говоре енглески језик (подразумева се сарказам). У неким земљама, попут Исланда, иако је матерњи језик исландски, невероватни Исландци одрастају учећи 3 језика! Будући да је Исланд земља усред Европе и Северне Америке, њихове компаније раде на више континената, језицима, дијалектима језика и више временских зона са свог радног стола!
Многе исландске веб странице су направљене на америчком енглеском, енглеском, исландском, шпанском, шпанском, француском и немачком језику! Замислите само како би било изазовно градити Ицеландаир'с веб апликације и системи за продају карата ... вау!
ОДРИЦАЊЕ ОДГОВОРНОСТИ: Имао сам апсолутно задовољство да радим са добрим људима из Ицеландаира и могу вам рећи да су то неки од најталентованијих и најљубазнијих професионалаца са којима сам имао задовољство да радим. То је једноставно невероватна земља и људи! Идите у посету ... узмите Ицеландаир и обавезно посетите Блуе Лагоон!
Језик наспрам кодирања
Постоје чак и различита кодирања знакова унутар једног језика која се међусобно не поклапају добро! Пример: Јапанска е-пошта написана у Схифт-ЈИС може постати нечитљива на рачунару Јапанца са локализацијом подешеном на ја-ЈП, јер њихов сервер поште препознаје само ЕУЦ-ЈП. Идеално би било да купац буде у могућности да постави које кодирање жели, као и који језик - једноставно осигуравајући да су кодирање и језик компатибилни са оним што клијент захтева.
Ако желим да читам јапански, можда ћу морати да одаберем и јапански као свој језик И Схифт-ЈИС за кодирање како бих правилно приказао тај језик. Ево још неке забуне коју треба додати мешавини ... неки типови кодирања подржавају неколико језика. УНИЦОДЕ / УТФ8 подржава десетине. Тачно је и обрнуто. Неки језици се могу читати у многим врстама кодирања. Ако то нема смисла ... Извињавам се, то је врло сложено питање.
Једног дана верујем (надам се) да ће се све то променити. Мислим да су се оригинални дизајнери локализацијских кодова надали да ће комбинација језик-држава бити све што је потребно ... али постали смо далеко софистициранији. Запамтите, много тога је развијено пре него што је постојао Интернет. Појавом ГИС-а, можда особа може да одабере своје кодирање, а ГИС ће се бавити информацијама о временској зони и локалном језику.
интернационализам
Повратак на подршку за интернационализацију. Ако желите да пружите интернационализовану апликацију, потребно је да:
- Подржавају више типова кодирања, језика и садрже датотеке превода за приказ тих превода.
- Дозволите клијенту да постави свој језик, па чак и можда свој тип кодирања, ако је потребно.
- Подржите временске зоне омогућавајући корисницима да референцирају своју временску зону у поређењу са ГМТ.
- Користите локализацијске кодове са опрезом ... они НЕ приказују тачно оно што ваш корисник заправо захтева нити оно што може прочитати.
превод
Машинско превођење је још увек у повојима. Постоји велики број веб локација (и WordPress плугинс) који нуде машинско превођење ваше веб локације. Немојте бити у искушењу да то учините ... два су разлога зашто:
- Ако машинско превођење функционише, корисник који проверава вашу веб локацију већ ће имати преводиоца за рад.
- Машинско превођење је срање.
Не верујете ми? Ево јапанског превода за вас:
Налепљено из Масатсу Филе - тип са гомилом слика мачака:
Јапански Блог Ентри
???????????
- 00:29:35 од масатсу??????????????????????????
????????????????????????????????????? (?)?
????????????????????????????????????
????????????????????????????????????????????????????????????????? (?)
Екстракција
??????????????
???????????
????????????????????????????????????????????????????
???????????????????????????????
????????????????????????????????????????
???????????????????????????????????
?????????? Аг ??????????????????????????????????????????????????????
Машинско превођење:
?? Ханн ?????
-00: 29: 35 МасатсуИме првог свеца слона који се појавио на јучерашњој флоти „а / звери песнице ?? ренџер ”“ ?? Ханн ???? ” са / радијским глумцем Иутака Мизусхима….
? (?) који сипу лако ради.
Јер чак и радио глумац првог светитеља, господару ????? а / мачка су кинеска дуња Нагаи Ицхиро = змајева кугла особље а / тхе ?? ренџер изгледа као људи које духовита опаска лако зна.
?????? (Зној) на који сам ове године потпуно заборавио „тајну имена супер флоте“, уобичајене праксе сваке године?,
?????? Ако ове године напишем са закашњењем,
??????? светилиште ??? (може како?)? јастук за рт (?? не сече) Фуками ?? (? или посматрати у могућности?) ан / тхе ис тхат ит доес
?????? Са, постаје „конзерва /? /?“, Другим речима, „кунг фу“, када се построји и промени глава а / имена.
?????? Иако се каже да ће повећати још два наводно, то би могло постати какво име.
За истину се каже да је „старост“, јер је симбол сребрног елемента Аг?, Иако је назив „тхе ???? сребро ”Такаока? техничар ??????? је размишљао да лик који се зове „?“ је коришћен са асоцијацијом сребрног екрана? филм, ако га зове са чланом сабирања.
?????? Међутим, размишљам себично, да моја теорија није неповезана да „?“ је укључено у / кинески карактер.
Сигуран сам да би преокретање поларности овог превода пружило једнако читљиву дикцију на енглеском језику. Разумели сте унос, зар не?