Back to Question Center
0

Семал разработва на URLitor - много готино уеб изстъргване и извличане на данни инструмент

1 answers:

URLitor е нов, но ефективен инструмент за извличане и извличане на данни в мрежата. За да използвате URLitor, трябва само да добавите списък с всички URL адреси, чието съдържание искате да остържете онлайн в предоставения шаблон. След това трябва да посочите HTML елемента, който искате да извлечете от уеб страниците, и да кликнете върху бутона за изпращане. Това е толкова лесно. С този инструмент вече не е нужно да правите копие или паста от браузъра.

xPath е език, който се използва за търсене на информация в XML файлове. Той използва определени изрази, за да избира възлови възли или възли в XML файлове. Изразите, които XPath разбира, са доста подобни на тези, които се използват с обикновени компютърни файлове или документи.

Въпреки че XPath се използва с няколко езици за програмиране, този инструмент е създаден за потребители, които нямат познания по програмиране. Така че, не е нужно да сте програмист, за да го използвате. С този инструмент можете да извлечете данни от няколко HTML и XML страници.

За опростяване на използването няколко често използвани XPath изрази са предварително дефинирани в падащото меню, така че потребителите ще трябва само да избират някоя от тях в зависимост от целта им. Опитни потребители на XPath обаче имат свободата да използват своите персонализирани изрази, когато пожелаят..

Инструментът е създаден с капацитет от 100 URL адреса в една сесия за остъргване и отнема максимум 10 израза наведнъж. С други думи, тя може да изстърже данни от максимум 100 URL адреса наведнъж.

Някои важни XPath потребителски изрази, които могат да бъдат модифицирани или добавени са описани полето по-долу:

1. // DIV [2] - Този израз избира втория дял йерархично;

2. // връзка [@ относителен = "канонични"] / @ HREF - Този израз избира местоположението (референтен) на маркера, който се използва за задайте атрибута rel, равен на каноничния;

3. / html / head / meta [@ name = 'description'] / @ content - Можете да използвате този израз, за ​​да изберете всички елементи с "име на класа" като CSS клас;

5. // h2 // заглавие - Този израз може да се използва за избор на първото H2 и заглавието на страницата;

6. // * [име

= 'h1' или име

= 'заглавието'] - Този израз работи точно като този по-горе. Въпреки това изразът, представен по-горе, е по-добър, тъй като е по-кратък;

7. // * [съдържа (@class, "малка")] - Този израз избира всеки елемент, който има CSS клас и също съдържа "малка" за извличане; - Този израз избира родителя на всеки елемент с текст "Добре дошъл" ";

Този инструмент е бета версия и все още може да работи с някои грешки. Въпреки това, той все още е чудесно средство за потребители с малко или никакво програмно познание, тъй като всички често използвани изрази са предварително дефинирани в менюто, както бе споменато по-рано.

December 7, 2017
Семал разработва на URLitor - много готино уеб изстъргване и извличане на данни инструмент
Reply