Уникальность текста?

Сообщений: 122 Регистрация: Ноя 2011

11 Декабря 2011 14:42

Подскажите сколько процентов должна быть уникальность текста?
И минимальная уникальность что бы яндекс не посчитал за копипаст?

Марьян Пильчак

Сообщений: 7396 Регистрация: Окт 2011

11 Декабря 2011 18:40

Смотря что за тематика.
80-90+% нормально.

Чем лучше тем лучше, не ужели это не понятно smile:)

А вообще лучше уж рерайт делайте чем копипаст

Изменено: Марьян Пильчак - 11 Декабря 2011 18:41

Оптимизация сайтов - Заказать!
У тебя пропали позиции? Сайт в АГС? Нету посещений? Позиции калл? Пиши мне!

levsha instruments

Сообщений: 974 Регистрация: Авг 2011

11 Декабря 2011 21:07

Цитата
Виталий Петренко пишет: Подскажите сколько процентов должна быть уникальность текста? И минимальная уникальность что бы яндекс не посчитал за копипаст?

1) программа, ищущая количество совпадений в фразах или использующая синонимические базы для определения степени похожести одного фрагмента текста на другие, НЕ может быть использована в качестве мерила уникальности текста.
2) один и тот же текст с разными стронгами УЖЕ является ДРУГИМ по смыслу текстом с точки зрения Яндекса.
3) один и тот же текст с другими подзаголовками УЖЕ является ДРУГИМ по смыслу текстом с точки зрения Яндекса, при этом уникальность, показанная программой может вас не устроить, а вот Яндекс вполне.

Дело не в подсчитанных выше написанным способом процентах, а в том, на сколько смысл текста будет признан яндексом отличающемся от других аналогичных. Яндексу интересно показать РАЗНЫЕ точки зрения на ту или иную проблему. Т.е. Яндексу интересно не количество похожего, а количество НЕ похожего в тексте. Грубо говоря, если вы возьмете текст и вставите в него несколько отрицаний "НЕ" делая из утверждений обратные утверждения, то ваш текст из 3000 символов, на 99% повторяющий исходный уже не будет восприниматься Яндексом как копипаст. Посудите сами, все делают одни утверждения, а вы вдруг взяли и сделали обратные утверждения. Ваша точка зрения УНИКАЛЬНА, это повод для Яндекса высоко оценить ваш текст или как минимум выделить его среди прочих.

4) Используйте ссылки на первоисточник и тогда ваш копипаст будет в индексе. Покажу на примере:
http://yandex.ru/yandsearch?text=%22%D0%B7%D0%BD%D0%B0%D1%87%D0%B8%D0%BC%D1%8B%D0%BC%20%D0%B1%D1%8B%D0%BB%20%D0%B7%D0%BD%D0%B0%D0%BA%20%D0%BA%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B0%2C%20%D0%BF%D1%80%D0%BE%D1%81%D1%82%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9%20%D0%BD%D0%B0%20%D0%BF%D1%80%D0%BE%D0%B4%D1%83%D0%BA%D1%86%D0%B8%D0%B8%3F%22&clid=1799179&lr=213&rd=0

В показанном примере в статье 2 ссылки, одна на продвигаемый сайт, а другая на блог автора.
Т.е. получается, что размещена одна и та же авторская статья на каждом из ресурсов, и в этом ничего плохого, заметьте нет, если соблюден копирайт. Яндекс не запрещает размещать на ресурсах авторские тексты, а самим авторам получать за это гонорары.

Изменено: levsha instruments - 11 Декабря 2011 21:12

evgkar3

Сообщений: 108 Регистрация: Окт 2011

11 Декабря 2011 21:21

Виталий Петренко,
ну во-первых разные программы показывают разную уникальность, во-вторых у Яндекса свой алгоритм проверки текстов и он может показать уникальность 10%, хотя тот же Адвего антиплагиат показывает 97%, а ETXT антиплагиат 89%. Если сделать рерайтинг, просто поменяв слова местами Адвего антиплагиат покажет 100%, а алгоритмы Яндекса 0%. Делайте глубокий рерайтинг или лучше копирайтинг, такие виды текстов Яндекс не причислит к неуникальным и следовательно не склеет.

argus

Сообщений: 446 Регистрация: Сен 2010

11 Декабря 2011 22:02

levsha instruments, слышала о таком, но Вы мне вот доходчиво объяснили:) Благодарю!

Компания Эскхостинг - это Ваш надежный хостинг!

levsha instruments

Сообщений: 974 Регистрация: Авг 2011

11 Декабря 2011 22:09

Яндекс проверяет уникальность (точнее, отличия точки зрения по освещаемому вопросу) при помощи поиска в тексте уникальных логических связок между ключевыми словами. Самое сложное для яндекса в этом - отличить уникальную связку от сгенеренной бредосвязки. К примеру, "поцелуй путина мальчика в пупок" был бы воспринят как сгенеренный текст, если бы фрагменты данной фразы больше нигде не встречались. Т.е. наличие в общей коллекции применимости разных ключей друг к другу определяют границу между креативностью и бредом. Именно по этой причине уникальные и яркие авторские тексты могут классифицироваться как сгенеренные. Именно в этом кстати причина того, что проект СРО не индексируется. Текст слишком креативен, скажем так, и одновременно слишком релевантен. Сочетание этих факторов вместе, являются сильно подозрительными и вызывают соответствующие проблемы-сайт воспринимается как дорвей.

Изменено: levsha instruments - 11 Декабря 2011 22:11

dimasoft

Сообщений: 756 Регистрация: Окт 2010

11 Декабря 2011 22:13

levsha instruments как тогда можно обмануть яндекс, как впихнуть безнаказанно копи паст , при минимальных телодвижений по изменению контента?

levsha instruments

Сообщений: 974 Регистрация: Авг 2011

11 Декабря 2011 22:16

Цитата
dimasoft пишет: levsha instruments как тогда можно обмануть яндекс, как впихнуть безнаказанно копи паст , при минимальных телодвижений по изменению контента?

привел пример выше. ставьте копирайт со ссылкой на источник.
или Вам именно обмануть яндекс нужно и чтоб ваш текст был признан им уником (полезной точкой зрения на освещаемую тему, которую следует оставить в выдаче)?
Если второе, то я таких советов не даю smile:)

(я не хочу выглядеть перед яндексом человеком, помогающим оптимизаторам обманывать яндекс, для меня это чревато. По той же причине я нигде не пишу как накручивать тИЦ).

Изменено: levsha instruments - 11 Декабря 2011 22:19

Yavor Parvanov

Сообщений: 2890 Регистрация: Июл 2011

11 Декабря 2011 22:21

Цитата

levsha instruments пишет:
К примеру, "поцелуй путина мальчика в пупок" был бы воспринят как сгенеренный текст, если бы фрагменты данной фразы больше нигде не встречались. Т.е. наличие в общей коллекции применимости разных ключей друг к другу определяют границу между креативностью и бредом. именно по этой причине уникальные и яркие авторские тексты могут классифицироваться как сгенеренные.

Что-то, может быть, верно. Однако по этой логике стихи Ахматовой для Яндекса - бредотекст, а многострочные предложения Льва Толстого - спам. Думаю, что для определения копии используется сходство в форматировании прежде всего: заголовки, подзаголовки, абзацы, пробелы, опечатки (явный фактор копирайтинга!), знаки препинания и сложные предложения, разделенные запятыми. Ну, и сами лексемы в предложениях, разбавленность текста другими фразами может повысить шансы. Лучше, наверно, копируя, начать со своего оригинального абзаца и заголовка (если нет желания ссылаться на оригинал). Однако вопрос о морали этим не решается.

dimasoft

Сообщений: 756 Регистрация: Окт 2010

#10

11 Декабря 2011 22:27

levsha instruments нет не обмануть, хотя работа оптимизатора это и есть попытка накрутки и обмана основном
Вопрос был таков как проще всего уникализировать текст, хотя (если верить вам smile:confused:

) я уже кое что понял

levsha instruments

Сообщений: 974 Регистрация: Авг 2011

#11

11 Декабря 2011 22:39

Цитата

Yavor Parvanov пишет:

Цитата

Описанные Вами способы применялись и применяются сейчас, но полином из этих факторов с ростом их количества теряет эффективность (из-за вырастающих погрешностей), поэтому рулит все больше принципиально другой способ, когда сравниваются не сами эти факторы, а причины их вызывающие. Т.е. сравниваются срезы запросных графоф (двумерную модель с весами смотрите в моей теме про оффшорный кейс, там я как раз привожу этот граф с долями соотношений ключей друг от друга). Именно они сравниваются, но не по одному запросу, а сразу по всем, которые есть в тексте.
Именно на этой технологии сейчас делают самые продвинутые языковые переводчики. Отпадает необходимость вообще в понимании семантической разметки разных языков, правил грамматики и пр. Оказывается достаточным сравнение самих спектров и наиболее близкие даже в разных языках будут иметь общий смысл. Скоро мы все будем смотреть на ПРОМТ и на его способности как на атавизм. Т.е. анализируется не слова, а именно смысл, а потом по смысловой структуре этого каркаса уже подбираются выражения для того или иного языка.

levsha instruments

Сообщений: 974 Регистрация: Авг 2011

#12

11 Декабря 2011 23:20

Цитата
dimasoft пишет: levsha instruments нет не обмануть, хотя работа оптимизатора это и есть попытка накрутки и обмана основном Вопрос был таков как проще всего уникализировать текст, хотя (если верить вам ) я уже кое что понял

Верить нужно не мне, а логике, которой следуют программисты яндекса в попытках смоделировать реальные оценки текстов и не только текстов (в противном случае у них просто начнут множиться баги). Они НЕ МОГУТ придумывать в этом смысле что-то свое, отличное от существующей объективно и независимо от них ЛЫЖНИ, ошибки будут откатывать назад и неправильную проекцию реальности будут переделывать в правильную.
Я лишь пытаюсь точно также моделировать метрики и на их основе предполагать, что будет работать в алгоритме и как именно, в т.ч. как обмануть (хотя это не самоцель). Качество моего моделирования может кого-то устраивать, кого то не устраивать, лично меня устраивает. Я не претендую здесь на то, что мое мнение является истинным и именно мои или аналогичные метрики использует Яндекс. Однако, я могу с высокой вероятностью гарантировать, что мои метрики как минимум лежат на поверхности и вероятность того, что их не заметила целая бригада яндексоидов, которая их разрабатывает, прошла мимо smile:)

.
Никто не мешает вам разработать и мысленными экспериментами проверить свои метрики и скорее всего, они тоже уже были придуманы яндексоидами и используются. Опираться на эти догадки, назовите как хотите, на практике оказывается ГОРАЗДО эффективнее, чем на сомнительные эксперименты и многочисленные мифы, которые плодят на серче.
Сегодня реинжиниринг в СЕО сильно смахивает на квантовую физику, где эксперименты практически невозможны или непомерно дороги (читай нерентабельны). Тем, кто сделал ставку на принцып: эксперимент-критерий истины, уже проигрывают. Отчасти потому, что эксперимент не чист с самого начала, отчасти потому, что в момент его проведения он потерял актуальность, но больше всего из-за потери драгоценного времени, которое на все это требуется. За динамикой изменения алгоритмов уже не угнаться. Единственный способ всегда быть в теме - это работать на опережение и разрабатывать метрики параллельно с яндексоидами, предугадывать как именно ДОЛЖЕН работать алгоритм, опираясь на то же, на что и они ВЫНУЖДЕНЫ опираться, и находить подтверждение своих догадок просматривая тонны ЧУЖИХ оптимизаторских воплей и стонов (которые по факту уже являются ответами на какой-то эксперимент. Нужно просто найти под какой именно эксперимент попадает тот или иной случай). Т.е. не выстраивать самому эксперимены, а использовать как экспериментальные данные то, что получилось случайно у других. Так гораздо быстрее и только так можно поспеть за чудовищьной динамикой Яндекса. Вот что такое современное СЕО ИМХО. Я не настаиваю на том, правильная эта позиция или нет, я просто ее озвучиваю. Возможно, это иногда выглядит слишком пафосно или вызывающе (за что меня и недолюбливают), но я не умею по другому. Этот форум принял меня какой я есть, и надеюсь все получили от этого немало пользы (взаимной) smile:)

Я бы не стал советовать выискивать способы минимизации уникализации текстов хотя бы потому, что в ЛЮБОЙ момент алгоритм может свести все ваши труды на нет. Я пользуюсь таким методом:
Я говорю копирайтерам, чтобы они при написании текстов по моим ТЗ (по части наличия в них ключей) в обязательном порядке показывали СВОЮ точку зрения на то, о чем они пишут.
Важно понимать, что яндекс ОСМЫСЛИВАЕТ текст, а не просто делает какие то простые сравнения. Если бы не было описанной выше корреляции смыслов при сравнении графов, не пошел бы яндекс в дотком...не было бы шансов.

Изменено: levsha instruments - 11 Декабря 2011 23:30

Yavor Parvanov

Сообщений: 2890 Регистрация: Июл 2011

#13

12 Декабря 2011 00:34

Цитата

levsha instruments пишет:
Верить нужно не мне, а логике, которой следуют программисты яндекса в попытках смоделировать реальные оценки текстов и не только текстов (в противном случае у них просто начнут множиться баги). Они НЕ МОГУТ придумывать в этом смысле что-то свое, отличное от существующей объективно и независимо от них ЛЫЖНИ, ошибки будут откатывать назад и неправильную проекцию реальности будут переделывать в правильную.

Вы, батенька, философ. Яндекс не может отклоняться от лыжни? Замечу, и Яндекс ,и Гугль свои лыжни создают на базе миллиардной статистики сайтов и без минимума теоретизации по поводу вашей проекции реальности и откатов. Попейте холодной воды, говорят, поможет в горячке. smile:)

Марьян Пильчак

Сообщений: 7396 Регистрация: Окт 2011

#14

12 Декабря 2011 06:22

Зачем пытаться когото обмануть, и подсовывать тексты с измененными буквами, синонимами, стронгами и прочим.
Мне кажется легче и проще открыть две статьи, и писать с нового листа, сделав другой вид, другие отступы, все то что через запятую в список, все то что ещё как-то ещё как-то. Вуаля. Получаем совершенно другой текст, и не кто не подумает что вы Это скопировали или отрерайтили.

levsha instruments

Сообщений: 974 Регистрация: Авг 2011

#15

12 Декабря 2011 13:54

Цитата

Yavor Parvanov пишет:
Вы, батенька, философ. Яндекс не может отклоняться от лыжни? Замечу, и Яндекс ,и Гугль свои лыжни создают на базе миллиардной статистики сайтов и без минимума теоретизации по поводу вашей проекции реальности и откатов. Попейте холодной воды, говорят, поможет в горячке.

Можно отклонятся куда угодно, однако ЗАКОНЫ возьмут свое (через баги). Законы социума как бы сказать...направляющие алгоритма.

При помощи статистики как раз эти социальные законы и выявляются. Философия-есть наука о логике, она учит как правильно следует ее применять, в т.ч. при обработке этой статистики.
Закон - от слова закономерности, т.е. по определению полученные и выявленные из обработки статистики.
Сложность в выявлении социальных закономерностей в интернете (в основе которых и лежат алгоритмы ссылочного ранжирования, понятия траст ранка и пр. понятий) заключается в том, что среда сбора статистики сильно отличается от привычной социальной среды в реальности, где статистика уже собрана и по найденным закономерностям написано множество книжек.
Попытки использовать накопленный опыт в реальном социуме и на его основе создать математическую проекцию терпят фиаско (ниже написано почему). Поэтому приходится ЗАНОВО открывать эти законы, хотя все это можно было бы просто совершить преобразованием координат.

Отклонение от этих закономерностей (ЛЫЖНИ) являются причинами несостыковок деталей модельной проекции между собой, как следствие это вызывает ошибки в ранжировании, требуются какие-то заплатки, лишние коэффициенты, которые сами собой бы сократились и минимизировались, если бы изначально был найден правильный вектор.

Вот к примеру задача:

сегодня на улице -3. Завтра обещают потепление в 2 раза.
какая будет завтра температура на улице?
правильный ответ +3

казалось бы, типичная ситуация, и всего то, нужно выдать результат уже в другой системе отсчета (за нулевой отметкой), т.е. грубо говоря, построить проекцию наподобие той, которая требуется для проекций известных социальных проекций в интернет. Правильный ответ получается путем ПРАВИЛЬНОГО преобразования координат при выполнении поставленной логической задачи.

усложним задачу:
сегодня на улице 0 градусов, завтра обещают похолодание в 3 раза.
какая будет температура завтра?
Температура реально есть и она действительно в 3 раза по градуснику будет ниже, а математического ответа нет. Как так?
Все не так хорошо в датском королевстве с царицей наук smile:)

Хворает она давненько так. Причем болезнь свою тщательно скрывает. Мало кто, к примеру знает, что ни один процессор не вычисляет операции с нулем, а истинные значения тупо ПОДСТАВЛЯЮТСЯ внутри самого процессора микрокомандами при вызове этой функции.

Яндексоидам ничего не остается, как продолжать придумывать эти проекции интуитивно или обходится статистическими данными исключительно в интернете, не прибегая к преобразованиям подобного рода. Другими словами, продолжать мучить нас с вами выдумыванием и проверяя на нас работоспособность своих гребаных метрик, от которых у нас волосы встают дыбом.

В задаче про температуру (как и в операциях с нулем) существуют НЕОТЪЕМЛЕМЫЕ доп. данные, которые и делают ответ корректным.
Эти доп данные просто следует учитывать и тогда математически задача решится. Нежелание математиков включать в условие "неразрешимых задач" доп данные, попытка избавиться от них, декларация их отсутствия лишь по причине того, что никто их в условии не указал, заводит саму математику в тупик.
Однако, формальная логика дает однозначные рекомендации, как поступать в таких случаях. Отсутствие доп данных в любой задаче, вовсе не означает, что их нет, и тогда согласно формальной логике происходит ВЗАИМСТВОВАНИЕ доп. условия для решения задачи в общем виде.

К примеру задача: стакан наполовину полон или наполовину пуст?
На самом деле, логика дает однозначный ответ на него:
Если вы наливаете стакан, то он наполовину полон, если пьете из него, то наполовину пуст.
Т.е. логика ВЫЗЫВАЕТ НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ доп условия, хотя в задаче они не определены.
Такое ПРАВО у логики есть не просто так, но не будем здесь объяснять, откуда это право у нее есть и почему матаппарат должен беспрекословно повиноваться этому праву. Это как раз уже чистая философия, это в ее компетенции объяснять математикам что и как следует делать (не забываем, откуда вообще появилась математика и чем она обязана формальной логике и науке о самой логике - философии).

Сама постановка задач, якобы не имеющих решения, согласно формальной логике уже является задачей, ПОСТАВЛЕННОЙ НЕ КОРРЕКТНО. Т.е. если вы задали задачу 3/0 то не задача не имеет решения, а сама эта задача поставлена не корректно (не полно), и решение задачи в таком неполном виде требует ВЫЗОВА дополнительных характеристик нуля. В зависимости от этих характеристик и будет выдан единственный и корректный логический ответ (решение). При этом характеристики этого нуля будут по умолчанию взяты не с потолка, а именно из той системы отсчета, откуда задается данная задача.
Т.е. если вы говорите про температуру по цельсию, то данная система в отрицательном пределе имеет цифру -273. Т.е. система отсчета "по цельсию" в котором нулевая отметка ПОДРАЗУМЕВАЕТ наличие этого абсолютного предела, выводит и корректный ответ на вопрос: "какая температура будет завтра?".

ответ: - 0,0109

т.е. 0/3=3/273

т. е. относительно новой системы отсчета, цена деления нового градуса будет 1\273=0.003663, соответственно, умножив это на 3 получим ответ 0.0109

Обратите внимание, что исходное условие "завтра будет холоднее в 3 раза" само по себе требует точку относительности, которой в свою очередь выступает также относительная величина (нулевая отметка по цельсию). Получается как бы относительная относительность. т.е. без привязки к абсолюту оба эти относительные точки не имеют содержательного смысла, поэтому логика получила ПРАВО взять то абсолютное значение, которое подразумевается для данной системы.

Похожие решения с преобразованием координат в связанных системах отсчета повсеместно используются в булевой алгебре (при вычитании в частности), поскольку если кто не знает, не существует в булевой алгебре такой операции "вычитание". есть только суммирование, но за счет побитной инверсии (так называемого доп кода) суть которой изменить критерии истинности в 0= истина и 1= фальш , совершить операцию сложения, а потом снова поменять критерии истинности системы для результата на 0=ложь а 1= истина. таким образом, получается обратная операция "вычитание".

Суть всех этих немыслимых преобразований, будь то числовых данных о температуре или скрывающимися за ними данными касательно статистики поведенческих закономерностей, заключается в том, чтобы попытаться построить правильные проекции реальных взаимоотношений между людьми для сайтов, не прибегая по возможности к тем саддистским методам, которыми яндекс пользуется сейчас.

Изменено: levsha instruments - 12 Декабря 2011 13:55

Похожие темы:

06.02.2017 14:58	Не находит в поиске по куску текста
04.05.2015 10:23	Как бороться с ворами материалов? Посоветуйте ресурс для массовой проверки статей на уникальность
25.11.2013 02:53	Авторство текста в Яндексе
26.07.2013 16:36	Можно ли убирать большой кусок текста одним махом?
27.06.2013 02:05	Сайт без текста, молодой, трафик 4к

Читают тему (гостей: 2, пользователей: 0, из них скрытых: 0)

Новые темы	Объявления	Свободное общение
23:30 Фильмы 2025 года 15:30 bequn.ru 10:47 Бесплатные посещения 20:17 Dao.AD: Монетизация и покупка Push/Pops/Inpage и Video трафика! 15:01 Adtrafico - Правильная партнёрская сеть под бурж трафик 18:41 Продвижение заграницей 22:36 Стоит ли добавлять сайт в Rambler топ 100?	23:45 Обменный пункт cashalot.one. Выгодный обмен. 21:06 USMobileSMSBot - 20:32 BestX24 - быстрый и безопасный обменник криптовалют и электронных денежных средств 19:17 Создам под вашу нишу сетку сайтов-сателлитов для привлечения целевого трафика 16:10 Whatsapp рассылки и реселлерская программа 16:03 PROXYTRAIL.com - Быстрые анонимные прокси по самым низким ценам 15:37 рассылки viber и whatsapp	19:39 Куплю проигрышные букмекерские аккаунты 05:42 Точные прогнозы на футбол 21:04 Есть ли альтернатива Адсенсу и РСЯ? 22:39 Кому выплата РСЯ пришла и какого числа? 12:12 Linux - это максимальная свобода 20:09 Сколько сейчас стоит наполнение ИМ? 04:33 Половина скидок на распродажах — фейк