rss
04/25/2024
EN   UA

Час i Події

#2022-08

Ваша точка зору

Чого, на Вашу думку, найбільше бракує Україні для перемоги?
Грошей
Зброї
Ядерної зброї
Міжнародної підтримки
Совісті найвищого керівництва
Ваш варіант відповіді
Комп’ютерна сторінка \ Спам у пошуковій системі: як його роблять і як з ним боротися

Зазвичай майже всі новоспечені володарі інтернет-сайту припускаюься однієї і тієї ж помилки: думають, що якщо сайт розміщено в інтернеті, то про нього відразу всі будуть знати. Помиляєтеся, шановні: для того, щоб сайт змогли знайти в інтернеті, потрібно, щоб про нього дізналася пошукова система. При цьому на пошукову систему можна почекати (раптом сама прийде, таке, до речі, теж буває), можна самому піти і зареєструватися, а можна і спробувати пошукову систему причарувати. Тобто, зробити так, щоб на вашу сторінку потрапляли всі підряд - і при цьому більшості таких відвідувачів, зрозуміло, ваша сторінка і задарма не потрібна. Навіть якщо ви не збираєтеся користуватися таким шаманством, знати, як воно робиться, вам зовсім не зашкодить: хоча б для того, щоб самому не потрапляти в такі пастки. Адже якщо мейловий спам сам приходить до вашої поштової скриньки, то тут вже ситуація інакша: до спаму ідете ви. Окрім того, дана стаття допоможе вам уникнути суттєвих помилок при створенні вашого веб-сайту - а відтак і зайвих проблем

Пошукові системи є одним з джерел потоку нових відвідувачів для будь-якого веб-сайту, тому недивно, що природне бажання кожного власника сайту полягає в тому, щоб посилання на його веб-сайт якомога частіше показувалися в перших позиціях результатів пошуку.

Дане питання, як і будь-який інше, можна вирішити двома способами: чесно, але довго, або нечесно, але значно швидше.

Одні веб-майстри складають списки передбачуваних умов пошуку, довго і копітко працюють над вмістом своїх веб-сайтів, організовують обмін тематичними посиланнями. Інші ж, ґрунтуючись на гіпотезах про принципи роботи пошукових систем, спеціально "підганяють" веб-сторінки так, щоб вплинути на їх відповідність до найпоширеніших запитів (релевантність).

Деякі веб-майстри доходять до того, що намагаються привернути відвідувача за всяку ціну - при цьому абсолютно не важливо, що відвідувач шукав в Мережі, лише б він зайшов на веб-сайт (у зв'язку з цим згадується веб-сайт одного інтернет-провайдера, який досить легко знаходився по запитах із словами: "колготки", "геї", і тому подібне). Такими методами частенько користуються для зароблення банеропоказів або накрутки лічильників відвідувачів .

Подібні дії є обманом як пошукових систем, так і людей, які шукають в Мережі потрібну ним інформацію, і називаються спамом пошукових систем або спамдексингом (spamdexing, від злиття англійських слів spam і indexing). Пошукові системи ведуть безперервну боротьбу із спамдексингом з метою підтримки своєї неофіційної репутації, побічно піклуючись при цьому і про інтереси своїх користувачів. У міру того як пошуковикив розробляють нові методи виявлення спаму, спамівські методи стають все більш витонченими. І процес цей, очевидно, продовжуватиметься до тих пір, поки в Мережі існує хоч би одна пошукова система. На те, що вимруть спамери, чекати не доводиться.

Пошукові системи по-різному реагують на виявлений спам: одні можуть видалити веб-сайт зі всіх своїх каталогів, інші - назавжди заборонити індексацію веб-сайту в своїй системі, але найбільш популярним методом в даний час є "м'яке придушення" - при цьому веб-сайт залишається і в каталогах, і в базі даних, але релевантність всіх його сторінок штучно занижується пошукачем при формуванні результатів пошуку.

Користувачеві у таких випадках на екран виводиться попередження, що найбільш подібні рехультати пошуковивк пропустив.

Таким чином, автор веб-сайту не отримує бажаного ефекту, і в той же час не може бути твердо упевнений, що його «підловила» пошукова система.

Дана стаття у жодному випадку не є прикладним посібником із спаму пошукових систем - навпроти, тут перераховані тільки ті методи спамдексингу, які успішно виявляються пошукачами. Ця інформація допоможе вам не зробити при створенні веб-сайту яку-небудь випадкову помилку, яка згодом буде розцінена пошуковою системою як спам. Природно, кожна помилка окремо (за винятком, звичайно, особливо кричущих) не викличе у пошукової системи різко негативної реакції, але поєднання декількох різнорідних помилок цілком може спричинити за собою включення механізму "м'якого придушення".

А зараз перейдемо безпосередньо до того, що пошукачі вважають спамом. Одним з найстаріших методів вважається некоректне використання html-тега <title>.

У ньому чесний веб-майстер пише заголовок своєї сторінки, нечесний - все, що спаде на думку.

Як відомо, при збігу пошукового запиту із заголовком веб-сторінки її релевантність помітно підвищується, у зв'язку з чим раніше можна було або заповнити тег <title> великою кількістю ключових слів (що часто не мають відношення до вмісту веб-сторінки), або помістити на одній веб-сторінці декілька тегів <title>. То ж відноситься і до мета-тегів description і keywords, а також до тегам <h1> (meta tags stuffing).

Ще один широко поширений метод - розміщення на веб-сторінці великих масивів ключових слів, які або забарвлюються в колір фону, або відображаються дуже дрібним шрифтом, або розміщуються де-небудь в кінці сторінки. Інший схожий варіант - розміщення на сторінці безлічі прозорих зображень розмірів 1x1 піксел, при цьому ключові слова прописуються в параметри alt тегів <img> цих зображень.

Спамдексингом називається сукупність неетичних методів підвищення релевантності документів

Так, наприклад, якщо ви наберете в пошуковику «День незалежності Гондурасу», то серед результатів можете натрапити на сайт одної з федерацій бойових мистецтв, де вони подають стенограму засідання Верховної Ради, присвячену Дню незалежності України. Зрозуміло, про Гондурас в самому тексті сторінки не буде жодного слова, про що «гугль» вам чесно скаже: слово «Гондурас» записано тільки в мета-тегах сайту. Той, хто справді шукав інформацію про Гондурас, буде розчарований, але все ж таки не зможе не помітити специфічного гумору розробника сайту.

Інколи розробники можуть познущатися над вмістом сайту серйозніше: тривалий час російські пошукові системи на запит, сформульований з російського нецензурного слова першим результатом подавали сайт Президента Росії.

Інколи до специфічних результатів можуть бути причетними не лише розробники сайту, а й хакери. А прив'язувати сайти президентів до нецензурних слів вони полюбляють - за що іноді й заробляють собі неприємностей на голову.

 

Як не наразитися на неприємності

Не слід повторювати одні і ті ж слова в мета-тезі keywords - це розцінюється як спам майже всіма поширеними пошукачами. Також вважається підозрілим, якщо слова, згадані в мета-тезі keywords, не зустрічаються в основному тексті веб-сторінки, або зустрічаються там дуже часто (keywords stuffing). Не дивлячись на те, що це може показатися неймовірним, деякі пошукові системи можуть аналізувати також і структуру основного тексту веб-сторінки, так що декілька пропозицій, що складаються з безладного набору ключових слів, цілком можуть привести сторожовий механізм в стан бойової готовності. Якщо задуматися, нічого дивовижного в цьому не немає - якщо, наприклад, Microsoft Word має механізм перевірки граматики, чом би і пошуковій системі не обзавестися подібним механізмом?

Підозрілими вважаються і редиректи (переадресація користувача на іншу сторінку), які спрацьовують за часом, а не за бажанням користувача, тому без особливої необхідності краще ними не користуватися. Хоча для таких редиректів можуть бути і абсолютно законні причини - наприклад, для автоматичного переходу по новому посиланню, коли веб-сайт переїздить в інше місце. Пошукачі уміють розпізнавати редиректи, організовані і за допомогою мета-тега refresh, і за допомогою яваскрипта. Останнє вже наводить на роздуми...

Повтор одних і тих же слів в мета-теге keywords розцінюється як спам майже всіма поширеними пошукачами

Грамотно розроблену веб-сторінку можна в розумних межах оптимізувати під декілька споріднених пошукових запитів. Але що робити, якщо хочеться оптимізувати її під більшу кількість різнорідних запитів? У таких випадках використовують дорвеї (doorways) - допоміжні сторінки, спеціально оптимізовані під конкретні пошукові запити. Зазвичай такі сторінки не несуть корисної інформації, а призначені тільки для того, щоб привернутий обманним шляхом відвідувача на веб-сторінку, для якої створювався дорвей (звідси і назва).

Думки щодо використання дорвєїв досить суперечливі. Поодинокі дорвєї спамом не вважаються, вся справа в співвідношенні загальної кількості дорвеїв і звичайних сторінок веб-сайту. Велика кількість дорвеїв, що розрізняються, для однієї і тієї ж веб-сторінки також вважається спамом. Якщо дорвей несе якусь інформацію, яка співпадає по темі з веб-сторінкою, на яку він посилається, то це може знизити його "спамність" в очах пошукової системи. Добре також, якщо на дорвей є справжнє посилання з власного веб-сайту, щоб пошуковий робот дістався до нього самостійно, оскільки реєстрація дорвеїв або суворо заборонена, або просто не вітається практично у всіх пошукових системах.

Ще один тип допоміжних сторінок, на який криво дивляться пошукові системи, - це гейтвеї (gateways) - сторінки, що складаються з великої кількості посилань. Приклад "офіційного" гейтвея - карта сайту.

Оскільки останнім часом релевантність стала дуже сильно залежати від посилань на ваш веб-сайт, до моди увійшов безладний обмін посиланнями, званий непотизмом. У зв'язку з цим при підрахунку релевантності кожного документа пошукачі не просто підраховують загальну кількість посилань на даний документ і веб-сайт, що містить його, але і порівнюють тематику обох веб-сайтів: якщо тематика співпадає, то релевантність документа підвищується, якщо ж немає - знижується. Якщо посилання на ваш веб-сайт належить спамеру, вже виявленому даною пошуковою системою, це також може спричинити за собою зниження релевантності ваших документів. Це ж застереження працює і у зворотному напрямі, так що хаотичний обмін посиланнями зі всіма вашими знайомими і тими, хто пропонує зробити такий обмін, принесе тільки шкоду, якщо ви не звертатимете увагу на зміст ваших веб-сайтів.

Спамом вважається також і створення великої кількості повністю однакових веб-сторінок і цілих піддоменів, або створення фіктивних веб-сайтів, єдиною метою яких є розміщення посилань на ваш веб-сайт (щоб уникнути звинувачення в непотізмі, подібні сайтики зазвичай містять декілька сторінок з тематикою основного веб-сайту).

І, нарешті, самим злісним посяганням на права пошукачів вважається клоакінг (cloaking) - "підсовування" пошуковому роботові спеціально оптимізованих для індексації веб-сторінок замість тих, які бачить звичайний відвідувач веб-сайту. Технічно це завдання вирішується тривіально, оскільки кожен пошуковий робот при зверненні до відвідуваного ним веб-сайту зобов'язаний формувати правильний http-заголовок User-Agent, по якому його легко ідентифікувати. Це ж правило сильно ускладнює автоматичне виявлення клоакінга, тому в даний час цей метод найбільш популярний.

Пошукові системи, природно, не можуть залишити такі дії безкарними, тому в даний час виявлення клоакінга проводиться в напівавтоматичному режимі, коли підозрілі для автомата веб-сторінки перевіряються вручну. Необхідність "ручних" дій пояснює жорстку політику всіх великих пошукачів відносно клоакінга: навічне видалення веб-сайту, що провинився, з бази даних (до речі, то ж відноситься і до "ручного" виявлення непотистів).

Небагато нагадує клоакінг метод підміни вмісту (code swapping): спочатку створюється законопокірна веб-сторінка, спеціально оптимізована для конкретного пошукового запиту, а після успішної індексації і досягнення потрібного рейтингу вміст сторінки замінюється на інше, реальне. Подібними методами користуються деякі компанії, які «професійно займаються» по розкручуванням веб-сайтів чи продають положення веб-сторінок в результатах пошуку. Навіть якщо така дія не буде розцінена як спам, "розкручена" таким чином веб-сторінка втратить своє високе положення після того, як буде проіндексовано її новий вміст.

І остання порада на закінчення цього довгого списку: для підвищення рейтингу свого веб-сайту ніколи не користуйтеся послугами компаній, у порядності якихі ви не упевнені повністю! Наприклад, результати роботи таких популярних автоматизованих засобів оптимізації веб-сторінок, як WebPosition Gold або AutoWeb легко може виявити пошукова система Google, а компанія по розкручуванню веб-сайтів, що свято зберігає в таємниці свого ноу-хау, цілком може користуватися забороненими методами, причому дізнаєтеся ви про це тільки через декілька місяців, коли пошукова система нарешті виявить факт спаму на вашому веб-сайті, так що ви втратите свої гроші і залишитеся у розбитого корита.

Щоб не зупинятися на цій песимістичній ноті, залишається відмітити, що горщики обпалюють зовсім не боги: будьте уважні, обережні, не шукайте легких обманних шляхів, і все у вас вийде!

За матеріалами сайту horayetsky.lviv.ua

Що таке кишеньковий комп’ютер (КПК)?

Свій куточок в інтернеті

 

Реклама

© 2006-2011 "Час i Подiї". All Rights Reserved | Chicago Web Design - Dropshipping suppliers