kireev: (Default)
kireev ([personal profile] kireev) wrote2011-11-23 09:32 am

Карта языков Твиттера

Весьма любопытные карты языков Твиттера.Тут во-первых можно смотреть на густоту юзеров твиттера, а во-вторых любопытны и языки, особенно в местах, где есть лингвистическое разнообразие, скажем, Испания, Бельгия, Швейцария, Канада и т.д. Карта в полном размере (очень большом) есть тут.



[identity profile] dmytro.livejournal.com 2011-11-23 02:44 pm (UTC)(link)
Where is Ukrainian???

[identity profile] kireev.livejournal.com 2011-11-23 02:50 pm (UTC)(link)
Да, я тоже обратил на это внимание. Мне как раз было бы интерено посмотреть на языковую карту украинского сектора Твиттера.

[identity profile] barouh.livejournal.com 2011-11-23 03:08 pm (UTC)(link)
А еще не видать фламандского. Баски? Не видно шведское меньшинство в Финляндии. И т.д. Языковые данные какие-то на мой вгляд странные

[identity profile] xou-chan.livejournal.com 2011-11-23 03:20 pm (UTC)(link)
фламандский с век отменили, признав его диалектом голландского и перешли на литературный голландский.

а валонцы перешли на литературный франзузский.

[identity profile] barouh.livejournal.com 2011-11-23 03:31 pm (UTC)(link)
упс. Сорри, не знал, что его официально объединили с голландским

[identity profile] oude-rus.livejournal.com 2011-11-23 04:04 pm (UTC)(link)
нет, не объединили.

[identity profile] barouh.livejournal.com 2011-11-23 04:15 pm (UTC)(link)
международный стандарт считает это одним языком:
http://en.wikipedia.org/wiki/List_of_ISO_639-1_codes и http://en.wikipedia.org/wiki/Dutch_language

[identity profile] oude-rus.livejournal.com 2011-11-23 04:24 pm (UTC)(link)
Я не совсем аккуратно выразился. Формально язык один и тот же, а на практике - нет: совершенно другое произношение и часто другие слова (по телевизору) -- за что язык часто называют флемишем. А если по жизни, то зачастую даже тяжело понять.

[identity profile] barouh.livejournal.com 2011-11-23 05:20 pm (UTC)(link)
так я же и говорил про "официальное" объединение

[identity profile] andriy69.livejournal.com 2011-11-23 06:21 pm (UTC)(link)
зато есть фризский язык в Нидерландах .. телевидение даже есть на этом языке.. а не показан

Almost half of Ukrainian Twitter-users write in Ukrainian

[identity profile] dmytro.livejournal.com 2011-11-23 02:53 pm (UTC)(link)
Згідно зі статистикою компанії Яндекс станом на осінь 2011, в Україні зараз 160 тисяч твітер-акаунтів – удвічі більше, ніж було минулого року. За рік Твітер став ще україномовнішим. Якщо в 2010 році українською хоч інколи твітили 29% твітерян України (тоді це становило 23 тисячі тві-користувачів), то зараз таких 45%, тобто 72 тисячі.
(http://uk.wikipedia.org/wiki/Twitter)

[identity profile] idelsong.livejournal.com 2011-11-23 02:58 pm (UTC)(link)
Отчетливо видны итальянские центры на юге Франции. Видны также русские центры в Ашдоде и Ашкелоне и частично в окрестностяз Иерусалима.

[identity profile] barouh.livejournal.com 2011-11-23 03:09 pm (UTC)(link)
Кстати, вот карта московских твитов того же автора:
http://www.flickr.com/photos/walkingsf/5925796869/

[identity profile] tiradorrus.livejournal.com 2011-11-23 03:52 pm (UTC)(link)
главная аллея ВДНХ аж прям оранжевой струной прочерчена.

[identity profile] barouh.livejournal.com 2011-11-23 04:13 pm (UTC)(link)
Оранжевые - это фотки на Фликре. Иностранцы щелкают. Еще они бродят по Коломенскому и Поклонной. И Лужники

[identity profile] tiradorrus.livejournal.com 2011-11-23 04:14 pm (UTC)(link)
это какъбэ понятно

[identity profile] oude-rus.livejournal.com 2011-11-23 04:01 pm (UTC)(link)
интересно, почему магистрали так хорошо прочерчены. вроде как народ должен жить вокруг них, а не строго вдоль.

[identity profile] Денис Иванов (from livejournal.com) 2011-11-23 04:13 pm (UTC)(link)
Людям в пробках делать нечего - вот и твиттят.

[identity profile] barouh.livejournal.com 2011-11-23 04:22 pm (UTC)(link)
видимо, местоположение определяется только при постинге со смартфонов с GPS. По IP для России не определяется или не определяется как правило
http://kireev.livejournal.com/690735.html?thread=11712815#t11712815

[identity profile] oude-rus.livejournal.com 2011-11-23 04:27 pm (UTC)(link)
непонятно, почему gps координаты привязаны к трассам -- это же все же не навигатор.

[identity profile] Денис Иванов (from livejournal.com) 2011-11-23 04:40 pm (UTC)(link)
Ну а что, из дома что ли со смартфона постить?

[identity profile] barouh.livejournal.com 2011-11-23 04:54 pm (UTC)(link)
Человек стоит в пробке и постит с айфона - определяются его точные координаты по GPS. Человек сидит дома или на работе и пишет с компьютера - Твиттер не определяет его координаты или определяет его примерно и неточно, запихивая куда-нибудь в центр Москвы

[identity profile] oude-rus.livejournal.com 2011-11-23 05:09 pm (UTC)(link)
ок, разумно.

[identity profile] oude-rus.livejournal.com 2011-11-23 04:30 pm (UTC)(link)
отвечая вам снизу, набрел на ответ: просто 3/4G наиболее провешен вдоль автотрасс. В Нидерландах, где сеть покрывает всю страну, ситуация равномерная.

[identity profile] barouh.livejournal.com 2011-11-23 04:57 pm (UTC)(link)
Для написания твита 3G совсем необязателен - вполне достаточно EDGE. Более того, в московских реалиях часто при буковках "3G" на экране скорость доступа оказывается даже хуже, чем при EDGE - из-за перегрузки сети или ее кривой отладки

Так что не думаю, что охват сетями 3G играет такую существенную роль

[identity profile] barouh.livejournal.com 2011-11-23 03:26 pm (UTC)(link)
Заметил большие различия в "паттернах" между странами. Есть страны, где точки с разной плотностью рассеяны по всей территории - это Италия, Португалия, Великобритания, Нидерланды, Норвегия, Греция, отчасти Германия. И есть страны, в которых вроде как твитят в основном в процессе перемещений между городами - Испания, Турция, Швеция, Россия. (Особый случай - Польша, где, судя по карте, твитят только в крупных городах и при этом не выезжают за их пределы)

Очень резкие "перепады" на голландско-немецкой и португальско-испанской границах заставляют предполагать, что все же эти "паттерны" - не реальные различия, а артефакты, вызванные особенностями сбора или анализа данных

[identity profile] barouh.livejournal.com 2011-11-23 04:20 pm (UTC)(link)
По некоторому размышлению нашел ответ: возможно, разница в том, что для одних стран Twitter корректно определяет место постинга по IP-адресу (для устройств без GPS), а для других (типа России) определяет некорректно или вообще не определяет. Во втором случае и получается сеточка из трасс

[identity profile] oude-rus.livejournal.com 2011-11-23 04:28 pm (UTC)(link)
скажу за Нидерланды-Германия: там действительно проходит резкая граница по заселенности. Нидерланды заселены равномерно и все покрыты 3G. Кстати, вот и ответ.

[identity profile] barouh.livejournal.com 2011-11-23 04:52 pm (UTC)(link)
На севере разница есть - Нидерланды более заселенные. Но вдоль Рейна заселены обе стороны границы. Карта не ахти, но лучше с ходу не нашел:
http://maps.unomaha.edu/peterson/funda/MapLinks/EuropeOverview/Maps.html

Скорее, развитость 3G (+ лучшая детализация базы по IP-адресам) является ответом

[identity profile] oude-rus.livejournal.com 2011-11-23 05:13 pm (UTC)(link)
ну, Рур как раз вполне нормален на обеих картах.

так что, видимо, и то, и то.

[identity profile] barouh.livejournal.com 2011-11-23 05:26 pm (UTC)(link)
Если внимательно посмотреть, то с голландской стороны плотная закраска твитами подходит к самой границе, а с немецкой стороны есть черная полоска между границей и крупными городами. Например, якобы почти не твитят жители городков, расположенных вдоль Рейна между Дуйсбургом и границей - насколько я понимаю, это вполне плотно заселенные места

Так что все-таки мне кажется, что все же можно достаточно уверенно предположить, что для жителей голландских городков у границы местонахождение хорошо определяется благодаря детальности базы IP-адресов голландских операторов, тогда как по другую сторону границы для таких городков IP не определяется или вовсе приписывается к ближайшему крупному городу

[identity profile] feanturion.livejournal.com 2011-11-23 03:47 pm (UTC)(link)
С чем может быть связан провал в яркости на востоке Португалии? Просто малая плотность населения или что-то еще?

[identity profile] feanturion.livejournal.com 2011-11-23 04:19 pm (UTC)(link)
Да вроде бы не особо безлюдные горы там.
И не такие уж и "горы", прямо скажем)

[identity profile] barouh.livejournal.com 2011-11-23 04:23 pm (UTC)(link)
Вероятно, плохая база IP-адресов, из-за чего не определяется местоположение при постинге с компьютера или с телефона без GPS
подробнее тут - http://kireev.livejournal.com/690735.html?thread=11712815#t11712815

[identity profile] feanturion.livejournal.com 2011-11-23 06:44 pm (UTC)(link)
Похоже на правду, спасибо.

[identity profile] xenonchik.livejournal.com 2011-11-23 03:56 pm (UTC)(link)
украински посчитали за русский, молодцы, лол

[identity profile] pollotenchegg.livejournal.com 2011-11-23 05:31 pm (UTC)(link)
вообще не посчитали
автор сказал что добавит

[identity profile] oude-rus.livejournal.com 2011-11-23 03:58 pm (UTC)(link)
ишь как Нидерландия-то полыхает.

[identity profile] timbes5.livejournal.com 2011-11-23 04:56 pm (UTC)(link)
Нигерия, Кения, ЮАР, а остального как бы нет?

Непонятно, что с Тайванем и Гонконгом.

[identity profile] pollotenchegg.livejournal.com 2011-11-23 05:30 pm (UTC)(link)
И фарси тоже забыли.

Цвета немного неудачные - польский с немецким, испанский и галисийским сливаются.

[identity profile] 22he-travnya.livejournal.com 2011-11-23 07:27 pm (UTC)(link)
Ещё литовский с русским. Кстати,на месте Литвы странная полупустота.

И трудновато поверить в отсутствие русского в Латвии и Молдове.

[identity profile] vasyl-babych.livejournal.com 2011-11-23 08:45 pm (UTC)(link)
Бред какой-то. Я кончно понимаю: русификация, и всё такое, но пока всё не так плохо, или, если точнее, не настолько плохо: ну хотя бы в Галичине должен преобладать украинский!

[identity profile] alekcnova.livejournal.com 2011-11-23 09:29 pm (UTC)(link)
Просто у автора до украиноязычных пользователей Твиттера пока руки не дошли. Обещал позже добавить

[identity profile] vasyl-babych.livejournal.com 2011-11-23 09:49 pm (UTC)(link)
Ну так а зачем в русские цвета закрашивать тогда? :)

[identity profile] alekcnova.livejournal.com 2011-11-23 09:51 pm (UTC)(link)
А вы думаете что в Украине, в том числе в Галиичне, нет русскоязычных твиттерян? Всё таки около половины украинских пользователей Твиттера пишут на русском

[identity profile] 22he-travnya.livejournal.com 2011-11-24 03:59 pm (UTC)(link)
Ну что вы, гораздо больше половины.

Там выше в коментах говорится, что 45% украинских твиттерян хоть иногда твитили по украински.
Возможно робот фиксирует просто специфические буквы украинского алфавита, тогда ещё меньше.