Цитата |
---|
Eye пишет:
Олег Савельев, так и не решена проблема с повторяющимися текстами. Они бывают дублируются один-в-один, бывает, что под одинаковым заголовком две статьи, различающиеся наличием в одной из них лишнего дополнительного абзаца, например. Даже на этапе отбора статей (например, хотя бы тысяч на 7-10 за раз) как ни старайся запоминать, какие статьи в корзине, но после покупки по факту статей 20 - дублируются.
Но ещё обиднее, когда через некоторое время заглядываешь в магазин, и видишь, что статьи, которые уже тобой приобретены, но ещё не использованы, находятся в продаже в магазине по второму (возможно, что уже и не по второму) кругу. Проблема существует с самого начала работы магазина и до сих пор не решена.
Не знаю алгоритмов кишков, но простой поиск по имеющимся материалам (тупо по совпадению заголовков полностью или на 75+%) выявил бы такие повторения практически полностью. И сохранять в архиве проданное, проверяя постоянно на совпадение с добавляемым, чтобы не допустить двойные-тройные продажи.
В конце концов, статей в магазине не многие миллионы и подобная задача не перегрузит даже 150-рублевый хостинг при правильном подходе. |
Проблема практически решена, такие статьи проскакивают согласен, но их не так много, но разработчики работают дальше над этим. Насчет заголовков, то можно было бы реализовать это, но не поможет, когда статей много, то заголовки могут быть одинаковые, но сами тексты разные. В основном проскакивают, если к примеру разница знаков разная, добавлено 1-2 предложения и система уже пропускает, это или от старого вебмастера такие подходы или операторы мои накручивают, вычислить сложно. Скорее всего внедрим, если текст идентичен и есть в одном на 20-30% другого текста, отличного от первого, то вторую статью не пропускать уже.