Како пузати по великој веб локацији и извући податке помоћу вриштећег жабљег СЕО Спидер-а

Сцреаминг Фрог СЕО Спидер

Тренутно помажемо неколико клијената Маркето миграције. Како велике компаније користе оваква решења за предузећа, то је попут паукове мреже која се годинама утка у процесе и платформе ... све дотле да компаније нису ни свесне сваке додирне тачке.

Са платформом за аутоматизацију маркетинга у предузећима попут Маркето-а, обрасци су почетна тачка података на веб локацијама и одредишним страницама. Компаније на својим веб локацијама често имају хиљаде страница и стотине образаца које треба идентификовати за ажурирање.

Одличан алат за ово је Вриштећи жабљи СЕО Спидер... можда најпопуларнија платформа на тржишту за индексирање, ревизију и издвајање података са веб локације. Платформа је богата функцијама и нуди стотине опција за готово сваки задатак који вам је потребан.

Вриштећи жаба СЕО Спидер: пузање и екстракт

Кључна карактеристика Сцреаминг Фрог СЕО Спидер је да на основу можете да извршите прилагођена екстракција Регек, КСПатх, Или ЦССПатх специфичности. Ово је изузетно корисно јер желимо да индексирамо клијентове веб локације и ревидирамо и хватамо вредности МунцхкинИД и ФормИд са страница.

Отворите алат Конфигурација> Прилагођено> Издвајање да бисте идентификовали елементе које желите да извучете.

вриштање жабе прилагођено вађење

Екран за издвајање омогућава практично неограничено прикупљање података:

Вриштање жаба СЕО Спидер Ектрацтион правила

Екстракција регуларних израза, КСПатх и ЦССПатх

За МунцхкинИД, идентификатор се налази у скрипти обрасца која се налази на страници:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Затим примењујемо а Регек правило да бисте ухватили ИД из ознаке скрипте која је уметнута на страницу:

Regex: ["']id["']: *["'](.*?)["']

За ИД обрасца, подаци су у улазној ознаци у Маркето обрасцу:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Примењујемо КСПатх правило да ухвати ИД из обрасца који је уметнут на страницу. Упит КСПатх тражи образац са улазом са именом формид, онда екстракција чува вредност:

XPath: //form/input[@name="formid"]/@value

Врискање жабе СЕО Спидер Јавасцрипт приказивање

Још једна одлична опција Сцреаминг Фрог је да нисте ограничени на ХТМЛ на страници, можете да прикажете било који ЈаваСцрипт који ће уметнути обрасце на вашу веб локацију. У склопу Конфигурација> Паук, можете да одете на картицу Приказивање и омогућите ово.

Врискање жабе СЕО Спидер Јавасцрипт приказивање

За пописивање странице је потребно мало више времена, наравно, али добићете обрасце које ЈаваСцрипт приказује на страни клијента, као и обрасце који су уметнути на страни сервера.

Иако је ово врло специфична апликација, невероватно је корисна док радите са великим веб локацијама. Апсолутно ћете желети да ревидирате где су обрасци уграђени у читаву веб локацију.

Преузмите Сцреаминг Фрог СЕО Спидер

Шта ви мислите?

Ова страница користи Акисмет како би смањила нежељену пошту. Сазнајте како се ваш коментар обрађује.