18 Kasım 2013 Pazartesi

SEO - Moz için kazanmak bir istatistik

Biz son zamanlarda bizim blog bazı korelasyon istatistikleri yayınlanmıştır. Bu istatistikler ilginç ve yolları (arama motorları bir temel prensibi SEOmoz Misyonumuz) çalışmak içgörü sağlamak inanıyorum. Benzer istatistikleri korelasyon neden ilginç görüşmek istediğiniz kullanılabilir hale getirmek devam edecek gibi son eleştiriler arkasında matematik çürütmek ve ne kadar heyecan verici matematiksel tartışmalara girişme nerede eleştirilere kesinlikle rebutted oluyor yansıtmak. Ben kısa bir süre için şimdi SEOmoz oldum ama çok göndermeyin. Bu yüzden hızlı bir hatırlatma ben tasarlanmış ve SEOmozın web dizini için prototip inşa yanı sıra arka uç kod proje için büyük bir bölümünü yazdı. Dokuz ay sonra prototip üzerinde başladı ve o zamandan beri geliştirmek devam etmiştir dizini sayfaları milyarlarca ile sevk. Son zamanlarda henüz sevk oldukça heyecan verici şeyler üzerinde çalışıyorum ve Page yetki ve etki alanı yetki yapmak için kullanılan modeller öğrenme makinesi yaptı. Ben bir mühendis ve değil normal bir blogger olarak, ben sormak biraz empati için benim yazı için - biraz teknik ama mümkün olduğu kadar erişilebilir hale getirmeye çalıştık.

Korelasyon önemli neden?

Korelasyon nedensellik ne kadar birlikte değişkenleri değiştirmek ölçerek bulmamıza yardımcı olur. Korelasyon nedensellik gelmez; bir diğer etkileyen başka nedenlerle değişkenleri birlikte değişiyor. Ancak, Eğer iki değişken ilişkili mısınız ve diğer ikisi de etkiliyor biz olabilir sonucuna üçüncü bir değişkenin her ikisi de etkiliyor olmalı. Bu değişken karıştırıcı bir değişken olarak bilinir. Korelasyon gördüğümüzde, biz bir sebep var--sadece biz anlamak için henüz bir karıştırıcı değişken olabileceğini öğrenmek. Nasıl-ebilmek biz yapmak korelasyon verileri kullanın. SEO örnek ele alalım. Bazen gebelik sırasında alkol içen kadınlar çekimser kadınlardan daha iyi sosyal becerilere sahip akıllı çocuk doğum olduğunu kanıtlar var. Korelasyon açıktır ama bir nedensellik değil. Değişkenler arasında nedensellik ise, sonra hafif içme çocuk zeki yapacak. Karıştırıcı bir değişken ise, hafif içme etkisi yoktur veya bile (ki sırasında gebelik yapan çocuk önemli ölçüde daha az zeki ağır içme verileri extrapolating tarafından önerilmektedir) çocuk biraz daha az akıllı olun.


Benzetme açıktı? SEOlar biz korelasyon istatistikleri gibi hamile kadınlar yaklaşım öneriyorum içme - dikkatli, ama çok fazla stres olmadan düşünüyor. Yetenekli bir programcı ve SEO sektöründe çalışan rağmen tıbbi tavsiyede almaz ve ben açıklaması basitlik uğruna yorumlanamaz :-) unutmayın

Veri ve yöntemleri üzerine bazı notlar

Biz-si olmak iki gol SERPs çözümlemek için bir metodoloji seçerken: kolay anlaşılır kullanım teknikleri en anlamlı veri iletişim kuracak ölçümleri seçin ve başkaları tarafından çoğaltılamaz bu hedeflere bazen çatışma, ama genellikle bizim sorun hala tutarlı en yaygın yöntem seçin. İşte biz vardı önemli seçenekleri hızlı bir Özet ve onlar için bizim en son sonuçlar arasında nasıl karar verdik: korelasyon verileri vs öğrenme modelleri Makina: makine model ve hesap için karmaşık değişken etkileşimler. Geçmişte, biz öğrenme modelleri bizim makine türevleri bildirdi. Ancak, bu sonuçlar oluşturmak zor anlamak zordur ve onlar doğrulamak zor. Bunun yerine basit korelasyon istatistikleri hesaplamak karar verdi. Pearson korelasyon vs. Spearmanın ilişki: Her ne kadar sadece doğrusal korelasyon önlemler en ortak ilişki Pearson korelasyon, ölçüsüdür. Bu sınırlama önemlidir: korelasyon sıralaması için ilginç tüm doğrusal düşünmek için bir neden yok. Bunun yerine Spearmanın korelasyon kullanmak için seçin. Spearmanın korelasyon hala oldukça yaygındır ve monoton herhangi bir korelasyon ölçme makul bir iş yok. Monoton bir örnek: gün gayet tekdüze günün saati ile korelasyon için nasıl iş arkadaşlarım çok öğle yemeği yedim, Kont. Düz bir çizgi değildir ve çok doğrusal korelasyon değil ama o hiçbir zaman azalıyor bu monoton korelasyon nedenle. Doğrusal bir örnek: sabit bir hızla okuduğum varsayarsak, sayfa ben okuyabilirsiniz miktarı doğrusal olarak okuma harcamak zaman uzunluğu ile ilişkilidir. Demek korelasyon katsayısı vs. havuzlu korelasyon katsayısı: biz toplanan verileri için sorgular 11.000 +. Her sorgu için belirli bir ölçü değeri pozisyon bir korelasyon katsayısı hesaplayarak sıralama korelasyon ölçebilirsiniz. Ancak, 11.000 + korelasyon katsayıları rapor etmek istemiyorum; veriler bizim veri kümesini nasıl ilişkili olduğunu gösteren tek bir numara bildirmek istiyorum ve nasıl istatistiksel olarak göstermek istediğiniz numarayı önemlidir. Bunu yapmak için yaygın olarak kullanılan iki yöntem vardır: korelasyon katsayıları ortalamasını hesaplar. İstatistiksel önemi göstermek için standart hata ortalamasının bildirebilirsiniz. Bütün SERPs sonuçlarından havuz ve küresel bir korelasyon katsayısını hesaplar. İstatistiksel önemi göstermek için standart hata bootstrapping olarak bilinen bir tekniği sayesinde hesaplayabiliriz. Ortalama korelasyon katsayısı ve havuzlu korelasyon katsayısı hem anlamlı istatistikler rapora olurduk. Ancak, bootstrapping havuzlu korelasyon katsayısının standart hatasını ortalama, standart hata kullanarak daha az yaygın olduğunu göstermek için gerekli. #1 İle gittik. Fisher Vs yok Fisher dönüşümü dönüşümü: Korelasyon katsayılarının korelasyon katsayıları ortalaması hesap yapmak yerine, bir dizi sayı ortalaması ne zaman bazen bir fisher dönüşümler katsayıları ortalaması (ters fisher dönüşüm uygulanmadan önce) hesaplar. Bu bizim problemimiz için uygun olmaz çünkü: büyük olasılıkla başarısız olur. Fisher dönüşüm katsayısı eksi bir tarafından bir bölme içerir ve bireysel bir katsayısı yakın bir ve ne zaman bir düpedüz başarısız kadar patladı. Her bir küçük örnek boyutları üzerinde ortalama katsayıları, yüz binlerce bilgisayar, çünkü çok büyük olasılıkla bizim sorunumuz Fisher dönüştürme başarısız olur. (Yani bizim sonunda standart hata büyük değil, bu katsayılarının üzerinde ortalama için büyük bir örnek var elbette) İki nedenden dolayı gereksiz. İlk olarak, dönüşüm avantajı çok beklemek daha yakın beklenen katsayısı ortalama hale olmasıdır. Bu özellik varsayar hiçbir şey yapmayacağız. İkincisi, katsayıları sıfıra demek gibi dönüşüm bu özelliği taşır ve bizim katsayıları büyük değildi.

Katie son eleştiriler için

İki blogcular, Dr. E. Garcia ve Ted Dzubia, eleştiriler bizim istatistiklerini yayınladı.


Her iki mesaj onların için yine de dikkat ve adil bir miktar aldık ve daha geniş SEO sanayi itibarını zayıflatmak için her iki mesaj aramak için yanıt vermek için gidiyorum. SEOmoz SEO sanayi, standartlarını yükseltmek ve haksız eleştiriler (gibi "Bu konferanslar konuşmacılar olmayan anlamda ve SEO mitler/hearsays/kendi saçma fikirler çok teşvik tam" veya Dzubianın, "her alanında başka anekdot hokus pokus ya da bir kararname Matt Cutts gelen şey" bizim istatistikler dışında iddia Garcianın talebi) korumak için çok çalışıyor. Biz de daha fazla korelasyon çalışmalar (ve benim yukarıda belirtilen sıralama modelleri kullanarak daha gelişmiş analizler) oluşturabilir ve böylece o kim bu araştırma verilerini istihdam istihdam metodoloji emin hissediyorum emin olmak için planlıyoruz. Arama motoru pazarlama konferanslar, SMX, OMS ve SES, sektörümüzün canlılık için gereklidir. Onlar öğrenmek yeni SEO danışmanları ve deneyimli SEOlar notlarımızı karşılaştırmak bir fırsat vardır. Sektörümüzün bu tür öznel ve haksız eleştirilere karşı iddia etmek zor olabilir, ama kesinlikle onların matematik çürütmek. Bu amaçla, Katie için Dr. E. Garcia tarafından yapılan dört önemli matematiksel eleştiriler ve Dzubia tarafından yapılan iki buradasınız.

1) Korelasyon katsayıları demek iddia çürütme Uncomputable

Bizim grafikler için ortalama bir korelasyon katsayısı hesaplaması. Böyle bir değer hesaplamak imkansız iddiadır. Dr. E. Garcia: Açıkçası Ben ve Rand istatistik hiç anlamıyorum. Korelasyon katsayıları katkı değildir.Çok kötü bir korelasyon katsayısı hesaplanamaz, ne tür ortalama korelasyon katsayılarının standart sapmayı hesaplamak için kullanabilirsiniz. " Bu iddia ile iki konu var: bir) akran gözden belgeleri sık sık yayımlanan ortalama korelasyon katsayıları; b) additivity "ortalama" iki farklı anlamları aynı değeri varsa ortalama uncomputable olmayacak eğer belirlemek için uygundur. Her konuda daha ayrıntılı ele alalım. bir) akran gözden makaleler sık hesaplamak A demek korelasyon katsayısı E. Garcia iddia eden araştırmacılar sık hesaplamanız ve hakemli makaleler içerir uncomputable bir şey. Burada are üç önemli gazete nerede araştırmacılar acımasız bir korelasyon katsayısı hesaplaması: "ağırlıklı demek korelasyon katsayısı arasında fitness ve genetik çeşitlilik 34 veri kümeleri için ılımlı 0.432 +/-0.0577 ortalaması ile" (Macquare Üniversitesi - "Korelasyon arasında Fitness ve genetik çeşitlilik", Reed, Franklin; Konuşma Biyoloji; 2003)


SEOmozs journal Nature gözden geçirenlerden, hem de MIT ve Stanford Araştırmacılar bir kampta ve

Hiç yorum yok:

Yorum Gönder