kireev: (Default)
[personal profile] kireev
Ничего себе: твиттер лучше предсказывает уровень сердечных заболеваний по графствам, чем доходы, курение или повышенное артериальное давление. Во всяком случае так говорит исследование ученых из Университета Пенсильвании. Если смотреть на то, какие слова люди используют в Твиттере, то можно очень хорошо вычилить процент сердечных заболеваний. Там, где люди больше используют счастливые слова и говорят о счастливых темах, уровень сердечных заболеваний ниже, чем в местах, где люди в твиттере ругаются и говорят о негативных вещах. На этой карте слева показан реальный уровень сердечных заболеваний, а справа  предсказанный на основе твиттера.



А на этом графике показано корреляции различных факторов с уровнем сердечных заболеваний по графствам. Твиттер тут явно в лидерах.

Date: 2015-01-23 09:54 pm (UTC)
From: [identity profile] misha-b.livejournal.com
У меня тоже большие сомнения по этому поводу. Думаю, что значительный overfitting. Они, правда, используют cross-validation, но это ничего не значит.

February 2026

S M T W T F S
1234567
891011 121314
15161718192021
22232425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 27th, 2026 10:58 am
Powered by Dreamwidth Studios