Маркетинг и аутоматизација е-поштеМаркетинг алати

Како пузати по великој веб локацији и извући податке помоћу вриштећег жабљег СЕО Спидер-а

Тренутно помажемо неколико клијената са Маркето миграцијама. Како велике компаније користе оваква решења за предузећа, то је попут паукове мреже која се годинама уткала у процесе и платформе све док компаније нису ни свесне сваке тачке додира.

Са платформом за аутоматизацију маркетинга предузећа као што је Маркето, обрасци су улазна тачка података на сајтовима и одредишним страницама. Компаније често имају хиљаде страница и стотине образаца на својим сајтовима који морају бити идентификовани ради ажурирања.

Одличан алат за ово је Вриштећи жабљи СЕО Спидер... можда најпопуларнија платформа на СЕО тржишту за индексирање, ревизију и вађење података са сајта. Платформа богата функцијама нуди стотине опција за готово сваки задатак који вам је потребан. Међутим, функције се протежу далеко од оптимизације за претрагу, са једном невероватно корисном функцијом за извлачење података са ваше веб локације док се она пописује.

Вриштећи жаба СЕО Спидер: пузање и екстракт

Кључна карактеристика Сцреаминг Фрог СЕО Спидер је да на основу можете да извршите прилагођена екстракција Регек, КСПатх, Или ЦССПатх специфичности. Ово је изузетно корисно јер желимо да индексирамо клијентове сајтове и ревидирамо и ухватимо вредности МунцхкинИД и ФормИд са страница.

Отворите алат Конфигурација> Прилагођено> Издвајање да бисте идентификовали елементе које желите да извучете.

вриштање жабе прилагођено вађење

Екран за издвајање омогућава практично неограничено прикупљање података:

Вриштање жаба СЕО Спидер Ектрацтион правила

Екстракција регуларних израза, КСПатх и ЦССПатх

За МунцхкинИД, идентификатор се налази унутар скрипте обрасца која се налази на страници:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Затим примењујемо а Регек правило да бисте ухватили ИД из ознаке скрипте која је уметнута на страницу:

Regex: ["']id["']: *["'](.*?)["']

За ИД обрасца, подаци су у улазној ознаци у Маркето обрасцу:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Примењујемо КСПатх правило да ухватите ИД из обрасца уметнутог на страницу. КСПатх упит тражи образац са уносом са именом формид, онда екстракција чува вредност:

XPath: //form/input[@name="formid"]/@value

Издвојите ознаке стила у линији

Помажемо клијенту да очисти веб локацију на којој су користили уграђене стилове на Елементор додатку да би прилагодили практично сваки елемент странице. Да бисмо идентификовали где су коришћени уграђени стилови, прегледали смо сајт са неколико РегЕк правила за прилагођено издвајање:

  • Спан Инлине Стил:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Инлине стил ознаке сидра:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Див Таг Инлине Стил:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Уметнути стил ознаке наслова:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"

Искључења

At Martech Zone, ми служимо сајт на више језика на различитим поддоменима. Пописивање ових превода није неопходно јер су сва средства и информације засноване на основном сајту. Због тога смо омогућили конфигурацију листе за изузимање и додали следеће правило:

.*\.martech.zone

Ово такође можете да користите да бисте прескочили пописивање непотребних путања као што су ознаке додавањем:

martech.zone/tag/.*

Такође не желимо да пописујемо наше АМП странице које се завршавају на ?amp=1, тако у

Конфигурација > Изузми одељак, такође смо додали:

https?://[^\s]+?\?amp=1

Платформа чак има и лепу методу за тестирање неких УРЛс против правила како бисте били сигурни да исправно функционишу пре него што попишете своју веб локацију.

СцреамингФрог > Конфигурација > Искључи

Сцреаминг Фрог СЕО Спидер ЈаваСцрипт Рендеринг

Још једна одлична опција Сцреаминг Фрог је да нисте ограничени на ХТМЛ- на страници, можете да прикажете било који ЈаваСцрипт који ће уметнути обрасце унутар вашег сајта. У склопу Конфигурација> Паук, можете да одете на картицу Приказивање и омогућите ово.

Сцреаминг Фрог СЕО Спидер ЈаваСцрипт Рендеринг

За пописивање странице је потребно мало више времена, наравно, али добићете обрасце које ЈаваСцрипт приказује на страни клијента, као и обрасце који су уметнути на страни сервера.

Иако је ово врло специфична апликација, невероватно је корисна док радите са великим веб локацијама. Апсолутно ћете желети да ревидирате где су обрасци уграђени у читаву веб локацију.

Преузмите Сцреаминг Фрог СЕО Спидер

Објављивање: Martech Zone користи своје партнерске везе у овом чланку.

Douglas Karr

Douglas Karr је ЦМО оф ОпенИНСИГХТС и оснивача Martech Zone. Доуглас је помогао десетинама успешних МарТецх стартапова, помогао је у дубинској пажњи од преко 5 милијарди долара у Мартецх аквизицијама и инвестицијама, и наставља да помаже компанијама у имплементацији и аутоматизацији њихових продајних и маркетиншких стратегија. Доуглас је међународно признати стручњак за дигиталну трансформацију и МарТецх стручњак и говорник. Даглас је такође објављени аутор Думмие'с водича и књиге о пословном лидерству.

Повезани чланци

Назад на врх дугмета
близу

Адблоцк откривен

Martech Zone је у могућности да вам пружи овај садржај без икаквих трошкова јер ми монетизујемо наш сајт путем прихода од огласа, партнерских веза и спонзорстава. Били бисмо захвални ако бисте уклонили свој блокатор огласа док гледате наш сајт.