Hov. Du er ikke logget ind.
DU SKAL VÆRE LOGGET IND, FOR AT INTERAGERE PÅ DENNE SIDE

Cloaking - Farligt!?

Side 18 ud af 20 (194 indlæg)
Fra Odense
Tilmeldt 22. Aug 07
Indlæg ialt: 2539
Fra  redWEB ApS Skrevet kl. 19:01
Hvor mange stjerner giver du? :

Jesper Jørgensen:

Enten er du sådan en statistikker med en smule kapacitet, og så kan du jo fortælle os hvordan Google gør det. Ellers også er du ikke, og så er fakta at du ikke aner hvad du snakker om.

Det er ikke helt galt vureret, i Scient Pol. uddannelsen er statistik og ikke mindst kvantitativ statistik og metode nogle kerneelementer som man bruger rigtig meget tid på.

Det er meget meget nemt at lave statistik på den slags data, det svære består i at finde ud af hvad man skal spørge om og hvordan man operationalisere ens afhængige, uafhængige og kontrolvariabler så man sikre at de data man trækker statstisk benyttes så de fortæller hvorvidt der er en signifikant sammenhæng mellem de afhængige og uafhængige variabler, eller om der er kontrolvariabler der besidder en større forklarende effekt.

Det er altså muligt at analyere data så trende, røde tråde fremstår der afslører eller påviser sandsyneligt misbrug af google igennem simple brug af statistik.

Fra Lyngby
Tilmeldt 26. Mar 05
Indlæg ialt: 9738
Fra  DEMIB HOLDINGS ApS Waimea Digital Skrevet kl. 19:35
Hvor mange stjerner giver du? :

> Det er meget meget nemt at lave statistik på den slags data, det svære består i at

En anden ting der gør det omstændigt for søgemaskinerne er de mængder af data der skal håndteres - vi snakker adskille petabyte. Det er simpelt hen en resursemæssig udfordring at lave komplekse beregninger på den type data. Og selvom man skulle tro at Google har alle de resurser i verden de skal have forholder det sig ikke altid sådan :) 

Fra Odense
Tilmeldt 22. Aug 07
Indlæg ialt: 2539
Fra  redWEB ApS Skrevet kl. 20:17
Hvor mange stjerner giver du? :

Ja men pointen er nu stadig den samme - selve statistikdelen er det simple. Der hvor udfordringen ligger er i operationaliseringen af de data der skal analysere så man rent faktisk får det output man ønsker.

Fra Lyngby
Tilmeldt 26. Mar 05
Indlæg ialt: 9738
Fra  DEMIB HOLDINGS ApS Waimea Digital Skrevet kl. 20:23
Hvor mange stjerner giver du? :

Jeps, men resurseforbruget er ikke desto mindre en væsentlig forklaring på, at de ikke "bare" ruller de mest avancerede analyser og filtre ud over et indeks med flere milliarder objekter :)

Fra Roskilde
Tilmeldt 30. Jul 06
Indlæg ialt: 2298
Skrevet kl. 14:41
Hvor mange stjerner giver du? :

Nu hvor jeg har fået lagt mig ud med det meste af Aminos (og sikkert også Danmarks) SEO kapaciteter har jeg en mindre tilståelse. Jeg ved ikke 100% hvoran Cloaking Systems løsning virker. Hvis nogen kan sende mig et link til en side der bruger det og/eller skitsere konceptet tager jeg hjertens gerne mine ord i mig hvis jeg tager fejl. Jeg fandt det så banalt at hvis man viser een html til Google og anden html til andre, så kan det opdages. Fx. er javascript en nem måde normalt at skjule tekst for Google, men naturligvis kan Google lave en "bot" det udfører javascripten og viser det endelige resultat. Jeg har antaget at Cloaking Systems løsning er mere avanceret (eller simplere) end som så, men kan selvfølgelig tage fejl.

Effektiv Markedsføring:
Een af de ting jeg har lært er fra den tid er, at man kan læse enormt meget ud af normalfordelingskurver. Hvis du har et website, der har en "normal" trafik og der pludselig oven i dette kommer en masse cloaked trafik, tror du så ikke det er en simpel sag for en nyudlært statistiker at få et fuldautomatisk alarmsystem bygget op ved at trække på disse data?

Hej Christian

Så må man jo gå ind og kigge på hvordan denne statistikker får adgang til de data hans skal analysere. For som udgangspunkt kan hverken du eller jeg eller Google se hvor mange besøgende der kommer til fx. www.designure.dk (forudsat jeg ikke brugte Google Analytics).

Kan Google så alligevel få info om trafikken til et site: Som det fremgår af denne artikel, får Google besked om besøgsmønstre for dem der viser pagerank i deres Google Toolbar. Hvis de ydermere overtræder deres privacy policy kan de få stort set alt at vide fra den browser brugeren anvender.

http://www.pcmag.com/article2/0,4149,904096,00.asp 

Hvis vi går ud fra at Google overholder deres Privacy Policy, får de adgang til et meget begrænset subset data over traffik til det pågældende site. Lidt ekstra info kan de fx. få fra Aleksa. Lad os sige at Google på denne vis observerer usædvanlig meget traffik, så kan dette stadig forekomme af naturlige årsager, hvorfor Google manuelt må kigge på om der foregår noget der ligger udenfor deres retningslinier. Så i bedste fald vil det være et semiautomatisk alarmsystem ofte baseret på et tyndt datagrundlag.  

Så så nemt ser jeg heller ikke at Googles arbejde er. deMib siger selv at det drejer sig om datastørrelse i petabyte . Jeg ved ikke helt hvor meget det er men det lyder højt og det er ikke noget man bare kører en ekstra algoritme på.

Mvh Jesper

PS. (og off topic) Du har stadig en fadøl tilbage til ved lejlighed, den er ikke glemt :-)

Fra Lyngby
Tilmeldt 26. Mar 05
Indlæg ialt: 9738
Fra  DEMIB HOLDINGS ApS Waimea Digital Skrevet kl. 14:54
Hvor mange stjerner giver du? :

> Jeg ved ikke helt hvor meget det er men det lyder højt og det er ikke noget man bare kører en ekstra algoritme på.

Nej, og det er netop også derfor de vælger deres kampe med omhu - som f.eks. når der nogle der provokerer dem tilstrækkeligt. Man kan så spørge sig selv, om det er en SEO leverandørs opgave at provokere Google på en måde der betydeligt øger risikoen for at kundens eget websites smides ud af Google. Det mener jeg ikke det her. Og jeg synes det er særligt problematisk hvis samme leverandør så påstår at det er helt risikofrit, når faktum er det modsatte.

I forhold til hvilken data Google har adgang til, så har de rigtig nok ikke adgangt til almindelig trafikdata fra et site - udover det de får fra analytics, deres egen referrer statistikjker og toolbaren. Men det er helkler ikke så meget den data der er vigtig. Det er derimod de meget klare trends der tegner sig når man analysere alt det andet data de har over tid.

Fra Roskilde
Tilmeldt 30. Jul 06
Indlæg ialt: 2298
Skrevet kl. 15:00
Hvor mange stjerner giver du? :

Thomas Rosenstand:

Og nogle af de "gamle" bliver af og til involveret med Google, inviteres til "uformelle samtaler" etc. Det hele sker på et fundament af non disclosure agreements og en gensidig respekt. Derfor kan du ikke forvente af hverken mig, deMib eller andre, at du får mere faktuelle oplysninger.

...Når dagen er omme, betyder det egentlig ikke så meget, om du eller andre tror på, at Google kan og vil tage action på den måde, der debatteres om her. Det eneste, der betyder noget, er, om man som virksomhed er parat til at tage risikoen. Det er en individuel betragtning, som enhver frit kan tage. Og der findes intet facit der - kun en samlet risikovurdering. 

Hej Thomas

Jeg er helt på det rene med at i er en gruppe der af forskellige årsager ikke kan udtale jer detaljeret, og det må man have forståelse for. Men meget af debatten omkring Google nærmer sig overtro, hvor det ikke længere er nødvendigt at forklare HVORDAN de udpeger et site som "beskidt" og i særdeleshed hvordan de undgår at udpege et "rent" site som værende beskidt. Jeg har en videnskabelig indgangsvinkel til det og leder derfor efter forklaringer. Dem har jeg så ikke fundet endnu, men processen er heller ikke helt uden værdi.

Mvh Jesper

Fra Odense
Tilmeldt 22. Aug 07
Indlæg ialt: 2539
Fra  redWEB ApS Skrevet kl. 15:08
Hvor mange stjerner giver du? :

Der kunne jo tænkes at være nogle rimeligt simple entry points for analyse af den trafik og de sites der indexeres.

1) Når et site eller en side indexeres har google aligevel fat i siden og det kræver ikke mange ressourcer ekstra at kører teksten igennem et check imod en liste eller nogle arrays af ord eller sætninger for at chekke for sammenfald. Det helt åbenlyste er jo selvfølgelig at ord som cloacking vil være på sådan en liste.

2) Analyse af domænenavne m.v. - det skulle være underligt om ikke man kunne opsætte nogle analysemetoder der ganske automatisk sender sites som har næsten identiske URLs med links til sitet med den næsten identiske URL. Jeg mener hvor svært kan det være at matche f.eks. URLs med 80% match i bogstaver der linker til hinanden

3) Google har tendendser på de organiske søgninger, uafhængigt at de enkelte websites besøgsdata, så kan google stadig se udsving i de organisk leverede besøgende igennem google.

4) Sammenkædning af ovenstående 3.

I det hele taget kan google relativt simpelt have nogle automatiske systemet kørende som sender et eller flere sites til manuel check, uden at det som sådan behøver have voldsomt store resourceomkostninger.

Fra Pompano Beach, Florida, USA
Tilmeldt 19. Apr 06
Indlæg ialt: 3762
Fra  Concept Interest TCON Services LLC Skrevet kl. 15:22
Hvor mange stjerner giver du? :

Hej Jesper

Så er vi ved at nærme os kernen! Det er fedt, at du interesserer dig for det på så højt niveau, som du skriver. I langt de fleste tilfælde er det også en enorm opgave for f.eks. Google at identificere, om f.eks. en cloaking er bestilt af sitets ejer, eller om der er tale om fjendtligt angreb.

Når en søgemaskines troværdighed udfordres så direkte, som det har været tilfældet her, er vi helt inde og rode med en del af deres eksistensgrundlag - nemlig kvaliteten af søgeresultaterne. Og det vil være en forbandet god grund til at afsætte ressourcerne til det. Når først de ressourcer er afsatte, ruller bolden til stor skade for alle.

F.eks. er der fundet andre cloakingsider for en af de virksomheder, der er oppe og vende i denne sag, end dem Cloaking System har udført. Og at der er udført cloaking på to forskellige måder af to forskellige firmaer for samme "brand domæne" - det er et spor, selv den mest skeptiske statistiker må bøje sig for. Så er vi nok ved at være der, hvor termen "overvejende sandsynligt" kan bruges. Og hvor Google med en vis ret vil kunne sige, at der er tale om en sikker sag...

Du har helt ret i, at der er megen overtro forbundet med, hvad søgemaskinerne kan og ikke kan. Nogle gange dukker der så kræfter op på banen, der slynger om sig med påstande, der er helt ude i hampen. Det støjer, og det giver unødig fokus og uro. Derfor er vi nogle, der forsøger - inden for de rammer vi kan - at slå fast, hvad Google kan og vil. Og hvad de ikke kan og vil.

Processen er spændende, og der er ingen tvivl om, at det vil være spændende at være flue på væggen inde hos Matt, når han nørder.

Fra Lyngby
Tilmeldt 26. Mar 05
Indlæg ialt: 9738
Fra  DEMIB HOLDINGS ApS Waimea Digital Skrevet kl. 15:33
Hvor mange stjerner giver du? :

Ronnikc, nu ved jeg ikke lige hvilke datamængder du har sidet med, men med de milliarder af objekter Google arbejder med og de hundrede af millioner af daglige søgninger, så er selv den mindste lille bit ekstra data eller analyse faktisk en kæmpe udfordring. Så det er ikke så enkelt at køre de tjeks du nævner i praksis henover hele indekset. Og det er bl.a. derfor det ikke sker automatisk og i bred forstand men mere selktivt. Naturligvis køres der masser af analyser, men selv Google har et loft for hvor mange resurser der er, og når hver enkel lille kodekørsel skal ganges med 20-30 milliarder - eller mere så bliver det altså til en hel del :)

Du skal iøvrigt være opmærksom på, at nogle analyser køres i forbindelse med crawlingen, andre når der indekseres, og andre igen kører i run time når der søges.

> Jeg har en videnskabelig indgangsvinkel til det

Jepser, det er såmænd også et meget fornuftigt udgangspunkt, men man skal så bare lige huske, at tage al videnskaben med i sine overvejelser - herunder også de sociale aspekter :)

Og selv når alt inddrages ståpr man stadig til bage med visse "gåder" der ikke nødvendigvis kan forklares. Det gælder iøvrigt indenfor meget andet videnskab også. Som nogle ved er jeg lidt involveret i at producere nogle high-end studiemikrofoner. og her oplever vi f.eks. at det der står i lærebøgerne om magnetisme ikke hænger helt sammen med virkeligheden - selvom det burde.

Side 18 ud af 20 (194 indlæg)