| 
    
        
     
     | 
    
    
  | 
Большой босс хочет свой Google... | ☑ | ||
|---|---|---|---|---|
| 
    0
    
        april    
     25.07.17 
            ✎
    08:13 
 | 
         
        Чтобы он пришел на работу, сел за компьютер, а у него там уже собрана вся информация по идущим в данный момент в интернете тендерам...
 
        Google я уже посмотрел - там одна строка нарисована на форме - это просто ;) но как собрать всю нужную информацию?  | 
|||
| 
    2
    
        iceman2112    
     25.07.17 
            ✎
    08:18 
 | 
         
        по идущем в Интернете тендерам (с)
 
        может на 1-3 ресурсов остановимся?  | 
|||
| 
    3
    
        Гипервизор    
     25.07.17 
            ✎
    08:19 
 | 
         
        (0) Покажите боссу google.gik-team.com     
         | 
|||
| 
    4
    
        mishaPH    
     модератор 
    25.07.17 
            ✎
    08:20 
 | 
         
        (0) твой босс хочет задаром работу целого аналитического отдела?     
         | 
|||
| 
    5
    
        april    
     25.07.17 
            ✎
    08:21 
 | 
         
        в прошлый раз отбрехался тем, что интернет платный и дорогой...
 
        сейчас безлимит... отмазка не катит в общем идея такая... берем сервер... на сервере программа... сканирует или интернет, либо выдачу яндекса, отбирает ссылки, сканирует, отбирает страницы с соотвествующими ключевыми словами... складывает в базу и выдает из базы любимому боссу... может что-то готовое уже есть на эту тему?  | 
|||
| 
    6
    
        iceman2112    
     25.07.17 
            ✎
    08:21 
 | 
         
        (4) Думаю босс не знает, чего он хочет.     
         | 
|||
| 
    7
    
        april    
     25.07.17 
            ✎
    08:22 
 | 
         
        да мой босс старый еврей... и полковник в запасе     
         | 
|||
| 
    8
    
        iceman2112    
     25.07.17 
            ✎
    08:22 
 | 
         
        в прошлый раз отбрехался тем, что интернет платный и дорогой... (с)
 
        вы друг друга стоите  | 
|||
| 
    9
    
        april    
     25.07.17 
            ✎
    08:23 
 | 
         
        я тоже думаю, что не знает, но как ему объяснить, что ему это не надо...     
         | 
|||
| 
    10
    
        ДемонМаксвелла    
     25.07.17 
            ✎
    08:24 
 | 
         
        (9) ему это надо, но у него на это не хватит денег     
         | 
|||
| 
    11
    
        april    
     25.07.17 
            ✎
    08:25 
 | 
         
        (8) тогда 1 ГБт - 14000 RUB стоил, сканировать весь интернет - предприятие разорится, так и сказал, что не так?     
         | 
|||
| 
    12
    
        iceman2112    
     25.07.17 
            ✎
    08:25 
 | 
         
        (9) Так, что там максимум 2-3 постоянных ресурса, где хранится "все информация по идущим в данный момент в интернете тендерам", пусть заходит на них и смотрит, там возможно даже подписка есть. 
 
        Считаем, 3 ресурса. в 3 клика получается + бесплатно  | 
|||
| 
    13
    
        iceman2112    
     25.07.17 
            ✎
    08:26 
 | 
         
        тем более нужны же тендеры не все, скорей всего, а по определенное тематике, так что это не ВЕСЬ ИНТЕРНЕТ сканировать нужно)     
         | 
|||
| 
    14
    
        vde69    
     25.07.17 
            ✎
    08:27 
 | 
         
        (0) я конфу писал именно для сабжа....
 
        если интересно - могу рассказать  | 
|||
| 
    15
    
        vde69    
     25.07.17 
            ✎
    08:28 
 | 
         
        (14) у меня не все площадки
 
        например фабрикант - работал, а сбер - нет  | 
|||
| 
    16
    
        2dolist    
     25.07.17 
            ✎
    08:29 
 | 
         
        (5) программа сканирует интернет
 
        Весь?  | 
|||
| 
    17
    
        25-11    
     25.07.17 
            ✎
    08:34 
 | 
         
        Орг. меры предложи. Обученная тобой секретарша каждое утро выкладывает сводку.     
         | 
|||
| 
    18
    
        NorthWind    
     25.07.17 
            ✎
    08:35 
 | 
         
        (0) есть площадки, которые агрегируют тендеры. В яндексе находятся на раз. Заключайте договор, и будут у него на столе тендеры, в чем проблема-то?     
         | 
|||
| 
    19
    
        april    
     25.07.17 
            ✎
    08:36 
 | 
         
        (14) расскажи, пожалуйста!     
         | 
|||
| 
    20
    
        vde69    
     25.07.17 
            ✎
    08:36 
 | 
         
        (14) + у меня реально работало по 4м площадкам, за год база тендеров без вложений копится примерно 1 терабайт
 
        реализовано 1. поиск оф лайн по ключевым запросам полнотекстового поиска 1с 2. работа с закрытыми площадками 3. рассылка по почте найденых тендеров и еще много плюшек из минусов - 1. сайты постоянно меняются и приходится постоянно поднастраивать парсинг 2. сайты на основе активных клиентских скриптов - не работают  | 
|||
| 
    21
    
        april    
     25.07.17 
            ✎
    08:37 
 | 
         
        (20) 
 
        на чем писал? сколько времени ушло?  | 
|||
| 
    22
    
        april    
     25.07.17 
            ✎
    08:38 
 | 
         
        (20)
 
        и как ты парсил закрытые площадки?  | 
|||
| 
    23
    
        vde69    
     25.07.17 
            ✎
    08:39 
 | 
         
        (21) на 1с, ушло примерно 5 дней на базу, и 3 недели на настройки парсинга     
         | 
|||
| 
    24
    
        vde69    
     25.07.17 
            ✎
    08:39 
 | 
         
        (22) сначало авторизация, потом обычный парсинг     
         | 
|||
| 
    25
    
        бегинер    
     25.07.17 
            ✎
    08:44 
 | 
         
        да полно таких сайтов аггрегаторов- покажи боссу:
 
        synapsenet. ru rostender. info  | 
|||
| 
    26
    
        april    
     25.07.17 
            ✎
    08:44 
 | 
         
        хм... а как авторизоваться из 1с?     
         | 
|||
| 
    27
    
        april    
     25.07.17 
            ✎
    08:45 
 | 
         
        (25) товарищ настоящий полковник желает свой с блэкджеком и...     
         | 
|||
| 
    28
    
        бегинер    
     25.07.17 
            ✎
    08:49 
 | 
         
        (26) покури:
 
        http://catalog.mista.ru/public/255881/  | 
|||
| 
    29
    
        бегинер    
     25.07.17 
            ✎
    08:51 
 | 
         
        ну и как вариант найти сайт аггрегатор который уже собирает всю инфу и парсить уже его...     
         | 
|||
| 
    30
    
        april    
     25.07.17 
            ✎
    08:57 
 | 
         
        (29) возможности парсинга выдачи яндекса и гугла ограничены... от таких умных     
         | 
|||
| 
    31
    
        Адинэснег    
     25.07.17 
            ✎
    08:59 
 | 
         
        накуя парсить яндекс и гугл     
         | 
|||
| 
    32
    
        бегинер    
     25.07.17 
            ✎
    09:00 
 | 
         
        (30) я про парсинг сайта ТЕНДЕРНОГО аггрегатора, а не про парсинг выдачи поисковика....     
         | 
|||
| 
    33
    
        Адинэснег    
     25.07.17 
            ✎
    09:00 
 | 
         
        авторизация точно такая же как и браузером
 
        пост, заголовки, etc  | 
|||
| 
    34
    
        NorthWind    
     25.07.17 
            ✎
    09:01 
 | 
         
        (26) очевидно, позвонить в эти конторы и поинтересоваться, кто и как позволяет делать интеграцию с учетными системами. Скорее всего, все уже давным-давно сделано за вас. И даже обработки для 1С могут быть готовые.     
         | 
|||
| 
    35
    
        april    
     25.07.17 
            ✎
    09:01 
 | 
         
        (32) 
 
        а для этого, как правило, надо авторизоваться на сайте... пошел читать http://catalog.mista.ru/public/255881/  | 
|||
| 
    36
    
        бегинер    
     25.07.17 
            ✎
    09:08 
 | 
         
        вот например ищет:
 
        https://synapsenet.ru/search открой ссыль например в опере, включи в опере режим разработчика. далее вбей в строку поиска нужный запрос и нажми на "лупу" - начни поиск. в окне режима разработчика на закладке "Network" увидишь все параметры: ================== Request URL:https://synapsenet.ru/search/setsearchoptions Request Method:POST Status Code:200 OK Remote Address:51.255.13.24:44 ================== Form Data query:!!!ЗдесьТексКПоиску!!! regionsIds: minPrice:0 maxPrice:0 skiptenders:0 take:undefined  | 
|||
| 
    37
    
        vde69    
     25.07.17 
            ✎
    09:14 
 | 
         
        (36) представь, что у меня 100...500 запросов на поиск по 10 площадкам, ищу каждый день...
 
        догадайся сколько это будет стоить  | 
|||
| 
    38
    
        бегинер    
     25.07.17 
            ✎
    09:22 
 | 
         
        (37) ну мы же не говорим счас про платный сторонний поиск через спец ПО, а про самописку автора, два варианта:
 
        легкий чтоб полковник отстал 1) найти сайт аггрегатор на котором есть бесплатный поиск, парсить его выдачу, найденное смотреть уже на самой тендерной площадке как вариант сложный: 2) определить список площадок, сделать себе ЭЦП, присоединиться - зарегиться ко всем площадкам, написать парсеры по всем площадкам, далее либо просто искать через 1с, либо если много регулярных запросов - то еще и копить результаты поиска нужных тендеров. либо оформить подписку на сайт аггрегатор и не париться: ждать когда автор напишет, либо купить и юзать сразу - это уже полковнику решать :) если у фирмы есть на это деньги...  | 
|||
| 
    39
    
        бегинер    
     25.07.17 
            ✎
    09:24 
 | 
         
        ну и еще вариант - скооперироваться с vde69 :)     
         | 
|||
| 
    40
    
        yegres    
     25.07.17 
            ✎
    09:57 
 | 
         
        (0) Попробуй https://tenderplan.ru/ Тестовый период 14 дней, очень удобный интерфейс, но денег стоит потом. Мне понравилась больше чем http://www.komtender.ru/ и http://rostender.info/     
         | 
|||
| 
    41
    
        lodger    
     25.07.17 
            ✎
    09:59 
 | 
         
        научи босса пользоваться гуглом.     
         | 
|||
| 
    42
    
        yegres    
     25.07.17 
            ✎
    09:59 
 | 
         
        а если бесплатно, то на http://zakupki.gov.ru можно найти необходимые тендеры, там указывается также площадка на которой размещен данный тендер     
         | 
|||
| 
    43
    
        Bigbro    
     25.07.17 
            ✎
    10:06 
 | 
         
        (0) покажите шефу где купить и скажите цену.
 
        $ 998,31 - цена акции гугла 689 238 589 - их количество. перемножить сумеет наверное.  | 
|||
| 
    44
    
        бегинер    
     25.07.17 
            ✎
    10:16 
 | 
||||
| 
    45
    
        бегинер    
     25.07.17 
            ✎
    10:19 
 | 
||||
| 
    46
    
        Вафель    
     25.07.17 
            ✎
    10:19 
 | 
         
        если боссу нужен просто гугл, то можно забить строку поиска и сохранить страничку в хтмл )))     
         | 
|||
| 
    47
    
        Базис    
     naïve 
    25.07.17 
            ✎
    10:37 
 | 
         
        Мелко плавает полковник (возможно, левый). Сделав свой гугл, он сможет продать его руководству нефтегазовой федерации, и тендеры ему уже будут не нужны.
 
        Дай ему книжку БГейца, business@think, пусть проникается.  | 
|||
| 
    48
    
        Garykom    
     гуру 
    25.07.17 
            ✎
    10:42 
 | 
         
        (47) Гугл (и прочие яндексы с мейлами) как поисковик довольно простая штука, но очень тяжелая и дорогая по железу с админами.
 
        Обычный парсер страничек, выявление ссылок с последующим парсингом уже их. В процессе индексируем тексты по методу N-грамм и складываем все в большую базу. Любой вменяемый веб программер справится (который парсер писал) но не сможет реализовать на конкурентном уровне ибо гугл уже далеко вперед убежал по разным тонким/хитрым моментам.  | 
|||
| 
    49
    
        _stay true_    
     25.07.17 
            ✎
    10:45 
 | 
         
        (46) И получить за это over9000k рублей!     
         | 
|||
| 
    50
    
        kyvv    
     25.07.17 
            ✎
    10:58 
 | 
         
        1С приглашает на работу питонистов и спецов по ML. скоро все будет искаропки.     
         | 
|||
| 
    51
    
        Exec    
     25.07.17 
            ✎
    11:01 
 | 
||||
| 
    52
    
        Exec    
     25.07.17 
            ✎
    11:02 
 | 
         
        +(51) По технологии SphinxSE осуществляется поиск на популярном блоге Хабрахабр, проекте Викимапия, популярном книжном интернет-магазине Буквоед, сайте "Санкт-Петербургского Дома Книги", BitTorrent-трекере Пиратская бухта и других высоконагруженных проектах[2]. Используется в CMS 1С-Битрикс[3], HostCMS [4], CMS LiveStreet, Umi.CMS версии 2.9.6 и выше, доступен с помощью плагина для CMS Wordpress[5] и т. д.
 
        В 2011 году была выпущена книга "Introduction to Search with Sphinx" издательства O'Reilly, написанная автором поисковика Андреем Аксёновым. Бери, используй, он GNU  | 
|||
| 
    53
    
        april    
     25.07.17 
            ✎
    11:13 
 | 
         
        (52)
 
        здорово! спасибо! родной php!  | 
|||
| 
    54
    
        april    
     25.07.17 
            ✎
    11:17 
 | 
         
        я тут сервер под проект подобрал! ;)
 
        2 Xeona, 32Гбт RAM, 2 HDD SAS 600 Гбт 15000 оборотов. Бойся, Google!  | 
|||
| 
    55
    
        wt    
     25.07.17 
            ✎
    11:17 
 | 
         
        (8) с ними надо говорить на их языке.     
         | 
|||
| 
    56
    
        Два Плюс Два    
     25.07.17 
            ✎
    11:18 
 | 
         
        (5) Бывают такие, но только по вакансиям работников http://qyzmet.kz     
         | 
|||
| 
    57
    
        Два Плюс Два    
     25.07.17 
            ✎
    11:19 
 | 
         
        +(56) Там он у них все доски объявлений сканит и в одном списке выводит с указанием даты последнего сканирования вакансии. Правда, он утратившие силу вакансии не убирает сразу. На этом сайте они продолжают висеть.     
         | 
|||
| 
    58
    
        april    
     25.07.17 
            ✎
    11:28 
 | 
         
        в общем так...
 
        на сервере FRee BSD или Linux, какая-то программа php, perl, python или что-то подобное, которая сканирует... ну например выдачу яши или гугла по определенным запросам, + указанные тендерные площадки (здесь указывается логин и пароль для авторизации), то что парсится складывается в базу (postgresql или mariadb)- URL, дата, текст к базе должен быть веб-интерфейс и возможность отправлять информацию письмами на e-mail, например маркетингу и боссу  | 
|||
| 
    59
    
        april    
     25.07.17 
            ✎
    11:29 
 | 
         
        + регламентные процедуры -например, убрать устаревшие данные давностью более чем за 1 месяц.     
         | 
|||
| 
    60
    
        Базис    
     naïve 
    25.07.17 
            ✎
    11:35 
 | 
         
        (58) ОЧЕНЬ ВАЖНО! 
 
        Должна быть возможность продавать корованы и покупать корованы.  | 
|||
| 
    61
    
        1dvd    
     25.07.17 
            ✎
    11:36 
 | 
         
        (60) а грабить?     
         | 
|||
| 
    62
    
        NikVars    
     25.07.17 
            ✎
    12:06 
 | 
         
        (0) Ввиду того, что львиная доля нужной информации не является структурированной по мудроправилам бигбоссов, всегда присутствует ручной сбор/отбор информации. И этот объем ручной работы очень и очень большой. А если добавить изменчивость хотелок бигбосов, то проще устно исполнителю получить указание и выполнить его, чем годами переписывать алгоритм какой-то проги, подстраивая ее логику под "хочу так, хочу этак".
 
        Для некоторых боссов научные институты годами информацию собирают. Другие организуют на деньги налогоплательщиков разные Администрации и/или нанимают заместителей, которые в свою очередь нанимают помощников.  | 
|||
| 
    63
    
        NikVars    
     25.07.17 
            ✎
    12:09 
 | 
         
        Да, еще забыл про Росстат и про разные переписи населения которые используются для получения информации.     
         | 
|||
| 
    64
    
        kyvv    
     25.07.17 
            ✎
    12:52 
 | 
         
        (61)У него же не новый шелковый путь, верблюды и товары свои.     
         | 
|||
| 
    65
    
        sitex    
     naïve 
    25.07.17 
            ✎
    12:59 
 | 
         
        (58) И сколько платите за такое изобретение ?     
         | 
|||
| 
    66
    
        1dvd    
     25.07.17 
            ✎
    13:02 
 | 
         
        (64) нельзя в одном предложении использовать слово "корованы" без глагола "грабить"     
         | 
| Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |