Как яндекс определяет, что текст синонимизирован и нечетабелен?
Страницы: Пред. 1 2
Как яндекс определяет, что текст синонимизирован и нечетабелен?
Vlad Straychenko,  яша тестирует что-то новое. Кто их знает? Что они там придумал? Зачем рисковать?
Не подписываюсь на темы, так что не слежу за вопросами, которые вы оставляете в топике после меня. Если нужно получить ответ, пишите в ЛС с указанием ссылки на мой комментарий.
То что яша плохо относиться к скрытому тексту или текст прописывается очень мелко, и тому подобное много статей где концовка у всех одна - сайт вылетает с индекса, по поводу сином...ера, конечно не напрягая мозг получать уник все хотят я первый куплю прогу если есть такая, ведь не обязательно генерировать по максимуму, да конечно уникум и 100% поднять можно но понятно текст будет просто белеберда (мягко говоря), при изменение текста до 50% текст очень даже читаем и прятать не чё не надо - скромно и мозг на месте.
Ок я понял, а если скажем сделать так в макет сайта ниже новости написать статью разбавляя ее выводом из доп полей или тегами пример: 
Спасибо вас, что вы посетили наш сайт и просмотрели новость {title}, которая находится в жанре:  {link-category}. Так же мы советуем к просмотру интересные новости: {related-news} (шаблон меняем на строчное перечисление через запятую). Также вы можете скачать музыку  [xfvalue_year] года. И изучить биографию певца:  [xfvalue_dir].
Уникальность будет около 30-60% для каждой новой новости.?? Как считаете такое можно использовать??
Что синонимизировать теперь тоже нельзя (((
Цитата
Vlad Straychenko пишет:
Слышал, что при синонимизации текста он получается на 90% уникальным, но читать такое невозможно, он становится нечитабельным. Интересно как Яндекс вычилсяет такие тексты. И возможно при помощи их придать уникальности краденной статьи?
Синонимы определяют контекст слова, т.е. указывают на него. Для каждого контекста существует свое применение, специализация, скажем так. Поэтому существуют разные словари в которых один и тот же термин трактуется и означает разное. Если термин из другого контекста применить в несвойственном ему (а это и видит яндекс), то текст получается кривой.
Существуют тематики, где игра контекстами составляет бизнес-процесс, он является рабочим инструментом у юристов, к примеру. Их хлеб в использовании синонимов таким образом, чтобы обязательства по тому или иному договору можно было использовать с точностью до наоборот. Вы прочитаете документ, где де факто вы отдали деньги и вам должны, а де юро вы сам должником окажетесь smile:)

Синонимайз, где контексты близки слишком сильно и человек не обращает внимания на мелкие искажения (смысл текста сохраняется, хотя и лишается красок) Яндекс может воспринимать как совершенно уникальный текст, чем и пользуется СЕО индустрия и говнокопирайтеры в частности. Однако прогресс не стоит на месте и Яндекс учится отличать синонимизированные документы и определять, является ли очередной текст повторением смысла уже имеющихся в коллекции. Т.е. критерием является наличие или отсутствие идентичного смыслового содержания.
Т.е. синонимайз, как таковой не определяется, определяется повторение смысла содержимого и последовательности его изложения.
Смысл любого документа представляется яндексом как набор измеренных взаимосвязей между ключевыми фразами о которых яндекс знает. Т.е. любой документ представляет собой некоторую конструкцию из них, где каждый ключ связан с другим отрезками, длина которых показывает степень родства одного ключа с другим. Чем больше степень этого родства, тем отрезок в этой конструкции, связывающий 2 ключа меньше. Степень родства или как ее еще называют, степень логической близости, находится из статистики частот применимости одного ключа с другим. К примеру, любой ВЧ потому и ВЧ, что имеет очень большое число совместной встречаемости в других ключах.
Вот вся эта конструкция и вычисленные для ВСЕХ известных яндексу ключевых слов степень их логического родства или близости, называется частотным ЗАПРОСНЫМ ГРАФОМ. Именно она обновляется при каждом апе и именно из нее вам выводят в вордстате статистику, которая обновляется несколько реже.
Вот этот частотный граф, в его форме и содержании, заключен СМЫСЛ всех понятий. И при семантическом разборе любого документа, яндекс для каждого формирует на базе общего запросного графа образ смысла этого документа, высчитывает принадлежность к той или иной тематике (путем оценки его логической близости ко всем категориям в ЯК), смотрит на сколько точно соответствует этот образ эталонному, отвечающий на поисковой запрос наиболее релевантно по нескольким поисковым целям в соответствии с классификатором по целям. В общих чертах, именно так происходит семантический анализ и ранжирование.
Яндекс уже очень давно различает текст и легко определяет работу синонимайзера. Морфология текста ему по зубам...
Ок я понял, но тогда как обьяснить сайты которые с успехом пользуются такими текстами к примеру тут: www.cinemaplayer.ru и обратите внимание на сцетчик посещений 20 тыс трафа в день! Не похоже что сайт под фильтрами)
Цитата
Vlad Straychenko пишет:
Интересно как Яндекс вычилсяет такие тексты.
да какая разница как? поверь определяет на ура, хочешь, можешь проверить, только время потратишь...
В любом случае первый визит (если траф попрет - он будет обязателно) любого из "смотрителей яндекса" повлечет налоение фильтра за недлялюдейный текст smile:)
Мы не можем похвастаться мудростью глаз
И умелыми жестами рук,
Нам не нужно все это, чтобы друг друга понять.
Сигареты в руках, чай на столе - так замыкается круг,
И вдруг нам становится страшно что-то менять.
Страницы: Пред. 1 2
Похожие темы:
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
21:07 Взрывной рост роботности в Метрике 
18:33 Trafee.com – эффективная монетизация вашего дейтинг трафика 
15:41 Adtrafico - Правильная партнёрская сеть под бурж трафик 
22:12 Stixi.ru. и stixi.com 
20:30 LOSPOLLOS.COM - Конвертим по рецепту Хайзенберга. Dating, Mainstream, Binary Options 
16:45 Adfinity - Ваш надежный партнер в монетизации трафика 
15:05 Gambling Craft - гемблинг по белому 
22:12 BestX24 - быстрый и безопасный обменник криптовалют и электронных денежных средств 
18:06 Coin Click.cc - Быстрый и надежный обмен электронных валют в два клика 
05:50 LunaProxy дешевый глобальный резидентный прокси $0,77/ГБ Ротирующийся прокси|Собственный IP|Безлимитный план 
16:11 Google Voice - OLD аккаунты "SMS и звонки" 
15:32 Sms.chekons.com - получения SMS на реальные номера USA, Sms.chekons.com - получения SMS на реальные номера USA 
15:26 TETChange-Обменник криптовалют 
12:30 Мобильные и Резидентные Прокси Для Соц Сетей | 3 Гб Бесплатно 
23:55 Точные прогнозы на футбол 
20:09 Сколько сейчас стоит наполнение ИМ? 
12:43 Куплю проигрышные букмекерские аккаунты 
04:33 Половина скидок на распродажах — фейк 
07:53 НейроБабушка наказывает мошенников 
19:59 Осталось 3-5 месяцев до блокировки YouTube в России, — заявил Клименко 
19:57 Пятница 13-ое: VK принял радикальное решение и закрыл доступ к порно контенту