Как приблизить говносайт к сайту для людей при минимуме затрат на его изготовление?
Многие считают – «Да возьмите вы уникальный контент и все!». Это бредятина. Во-первых, само понятие «уникальный контент» давно изжило себя. Нагенерировать миллионы символов уникального (по формальным параметрам) контента можно на несколько часов – но вылетать из индекса он будет намного быстрее, чем хороший копипаст.
Куда логичнее парсить контент с сайтов, которые это разрешают вполне легально. Сложно найти? Ну так активнее ищите. Скажу лишь, что полезной информации не таких сайтах несравненно больше, чем на сайтах, чьи хозяева трясутся над каждым символом… копирасты хреновы. Их тоже парсите, если не боитесь :)
Можно и не парсить. Есть такое давно устаревшее понятие, как библиотеки. Да-да, обычные «офлайновые» книгохранилища эпохи бумажных книг. Они до сих пор существуют, и они до сих пор бесплатны. Почитайте внимательно законы, посмотрите, с какого года издания книги уже не подпадают под закон об авторском праве – и вперед, сканируйте!
Но формально уникальный контент еще не превратит ваш сайт в полноценный СДЛ (сайт для людей). Куда важнее уникальность представления информации. Интересная тематика сайта, продуманная нестандартная структура, парочка оригинальных авторских статей – все это, по крайней мере, создаст иллюзию того, что сайт делался не исключительно для заработка денег, а для удовлетворения интеллектуальных потребностей его посетителей.
Закрывайте дубли контента от индексации! Теги, даты и т. п. – все, что создает повторение информации в рамках одного и того же сайта, нужно безжалостно закрывать от индексации в robots.txt. Избавляйтесь также от служебных страниц в выдаче – страницы поиска по сайту, версии для печати (а они часто бывают в нескольких вариантах) и т. п., все это также должно быть закрыть от индексации.