Собственная поисковая система как новый способ привлечения посетителей на сайт.
Страницы: 1
Собственная поисковая система как новый способ привлечения посетителей на сайт., Софт для создания собственной поисковой системы
Всем привет!
Проблема поиска по сайту является сложнорешаемой и не всегда реализуемой в рамках тех бюджетов, с которыми сталкиваются вебмастера. А если попытаться организовать поиск  по собственной сетке сайтов, это становится совсем нерентабельным предприятием. Например, у такого сервиса как elastic за поиск только по одному домену до 5К страниц необходимо будет заплатить $79/month, а если вам нужен поиск по большему количеству сайтов и страниц, то это уже $199/month + $30 за каждый сайт и столько же за каждые дополнительные 5К страниц.

Да, есть бесплатные решения у того же Elastic и Sphinx, но они требуют подключения к базе данных сайтов и тонкой настройки для каждого сайта (в каких полях искать, какой вес должен быть у найденной информации, как ранжировать). Для создания небольшой поисковой системы необходимо создать свои краулеры, разработать стратегию сканирования, сохранить полученную информацию в свою базу и там уже применить бесплатные решения Elastic или Sphinx. Но такой путь очень длинный и может дать не совсем тот результат, который мы ожидаем. Например, банальный поисковый запрос «саженцы абрикосов» дает 0 результатов, в то время как на запрос «саженеЦ абрикосА» поисковый движок выдаст множество результатов.

Учитывая вышесказанное, можно сделать вывод, что в мире сайтостроения не хватает простого, быстрого и максимально дешевого решения для организации поиска по сайтам, что позволило бы создавать небольшие поисковые системы.

Приглашаю всех желающих протестировать движок поисковой системы, которую можно легко установить на  VPS сервере или на обычном ПК для поиска по одному сайту или по группе сайтов. С помощью Kavunka 2.1 вы можете создать маленькую поисковую систему по тематическим сайтам: интернет-магазины, продажа недвижимости, авто-мото и.т.д. Также Вы сможете настроить выдачу таким образом, что пользователь сразу будет видеть картинку, цену, рейтинг товара или услуги.

Kavunka написана на Си и работает под управлением ContOS 7 (с помощью VMware Workstation можно использовать в Windows), легко масштабируется (от VPS 1 Core 1GB RAM  до высокопроизводительного сервера). Управление и настройка поисковой системой производится через веб-интерфейс. Kavunka распознает язык текста (ru, en, it, fr, pt, es, pl, uk), может исправлять ошибки в запросах пользователя и делать подсказки во время ввода поискового запроса, реализован стемминг. Kavunka автоматически собирает ключи и определяет уникальность текста, может пошагово пропускать HTML-код страницы скандируемого сайта через регулярные выражения и отдельно сохранять результат вебскрепинга в виде JSON-строки, тем самым давая возможность получать данные в виде отчета. Присутствует возможность сканировать не весь сайт, а только страницы с определенными ключевыми словами или urlами, которые содержат определенные признаки. Так же стоит упомянуть об интеграции с технологией Selenium (взаимодействие с реальным браузером Firefox) и возможности использовать proxy. Это делает данный софт еще и мощным парсером.

Демонстрацию возможностей  Kavunka 2.1 вы можете увидеть на примере созданной мною агропоисковой системы - https://kavunka.com.ua/draw.php?filerequest=saghenciy-abryikosov-abryikos-1

Как видите, у слова абрикос и саженец есть много словоформ. Выдача приобретает совсем другой вид, если выводить: цену, рейтинг и картинку. На момент написания этого поста в индексе данной поисковой системы присутствует всего 43 сайта, общее количество страниц составляет 31 317. Это далеко не предел, так как в предыдущей версии Kavunka 2.0 в индексе было 1200+ сайтов с общим количеством страниц около миллиона, но из-за того, что были изменены алгоритмы сканирования и парсинга, всю информации пришлось удалить.

Ознакомиться и установить поисковую систему - https://kavunka.biz/started.php

Со своей стороны гарантирую поддержку и маленькие бонусы в виде годичных лицензий первым десяти установившим Kavunka 2.1, а на период бета-тестирования лицензии будут продлеваться бесплатно по запросу в службу поддержки.
К чему такой огромный текст?
Цитата
WGN пишет:
К чему такой огромный текст?
 у меня то же не хватило терпения и до середины дочитать)
Шаблоны сайтов - Теперь всё бесплатно!
Как будто машинный перевод
Страницы: 1
Читают тему (гостей: 1, пользователей: 0, из них скрытых: 0)
Новые темыОбъявленияСвободное общение
16:11 Давайте начнем обмен отзывами Google maps 
22:14 Webvork - международная товарная СРА сеть с сертифицированными офферами на Европу. 
13:03 AntiBot Cloud - бесплатный скрипт и сервис защиты сайтов 
13:04 DreamCash.tl - заработок на онлайн-видео. До 95% отчислений, отличный конверт! 
20:13 Dao.AD: Монетизация и покупка Push/Pops/Inpage и Video трафика! 
15:04 Adtrafico - Правильная партнёрская сеть под бурж трафик 
19:21 LOSPOLLOS.COM - Конвертим по рецепту Хайзенберга. Dating, Mainstream, Binary Options 
19:49 Sectormoney.com - быстрый и удобный обменник 
18:51 TELEGRAM EXPERT — Многоцелевой комбайн по работе с Telegram! 
04:17 Просто $0.04/IP 9PROXY.COM Резидентные прокси Неограниченная пропускная способность Уникальная политика замены Без чёрного списка 
02:16 BetaTransfer касса — это надежный сервис приема платежей в сфере High Risk 
21:43 Coin Click.cc - Быстрый и надежный обмен электронных валют в два клика 
15:03 Продам аккаунты 1 ТБ Облако@Mail.ru 
14:59 PlayPay.biz - Лутбоксы с товарами, играми 
23:14 Точные прогнозы на футбол 
20:09 Сколько сейчас стоит наполнение ИМ? 
12:43 Куплю проигрышные букмекерские аккаунты 
04:33 Половина скидок на распродажах — фейк 
07:53 НейроБабушка наказывает мошенников 
19:59 Осталось 3-5 месяцев до блокировки YouTube в России, — заявил Клименко 
19:57 Пятница 13-ое: VK принял радикальное решение и закрыл доступ к порно контенту