
此文是惠州包裝設計公司關于設計公司如果推廣和營銷企業(yè)的分享,惠州包裝設計公司旨在想讓更多的設計公司提高設計業(yè)務能力!
注:配圖為UCI設計公司作品
在大學里,我上了一堂統(tǒng)計學課,我們花了一個半月的時間用撲克牌計算特定結果的概率。這是迄今為止最有趣的概念之一,我確信它會成為我余生中難以置信的實用數(shù)學工具(坦白說,它沒有)。
在那堂課上,我還背了一次期中考試的統(tǒng)計顯著性的定義。尋找重要性的計算對我正在處理的任何東西來說都太復雜了,所以我很快就忘記了除了定義以外的任何東西。
畢業(yè)后,我開始了我在數(shù)字營銷領域的工作,我的目標和許多營銷人員一樣:"盡可能快地測試一切,并在幾個月內實現(xiàn)業(yè)務增長"。
如果你讀完之后咯咯地笑了,那是因為你可能已經在市場營銷領域呆了足夠長的時間,知道得更多。在這一點上,我也是。好的、數(shù)據驅動的營銷需要時間、努力,不僅僅是知道統(tǒng)計學意義的定義就能成功。
統(tǒng)計學意義的學術觀點
統(tǒng)計顯著性的含義簡單明了,定義為:
"……兩個統(tǒng)計數(shù)據之間的測量差異是測試變量中真實差異的結果而不是偶然結果的概率。這意味著一個測試的結果不是隨機或偶然出現(xiàn)的,而是因為被測試的特定變化,所以它可以歸因于特定的原因。"
基本上,你在一個特定的活動或特定的測試中發(fā)現(xiàn)的令人敬畏的結果有可能會隨著時間的推移而保持不變(或有害)。
有幾種方法可以計算重要性:
執(zhí)行計算兩個樣本的標準差、計算每個樣本的方差、查找z指數(shù)并將其與t評分表進行比較的步驟,以確定結果是否距離中間值足夠遠,從而確定結果是否顯著。
使用一個計算器來計算重要性,就像這個。
如果您以百分比形式計算顯著性,您希望它盡可能高(如果您保留真實形式的p值,目標是使它盡可能低)。對于學術研究,一般把90-95%解釋為門檻。也就是說,您的結果有95%的可能性是由您的變量導致的用戶行為差異造成的,而觀察到的差異有5%的可能性是由偶然因素造成的。
如果數(shù)據達到顯著性水平,那么就有足夠的數(shù)據來拒絕零假設,其中零假設是我們想要反駁的點(例如:在一個測試中,我將一個按鈕的顏色改變?yōu)閹追N不同的色調,我的零假設是按鈕的顏色無關緊要。我想證明這個觀點是錯誤的)。
相反,如果在一項徹底的研究中,置信水平低于95%,就可以說沒有足夠的證據來拒絕零假設,研究者應該用一組新的變量重新測試,或者選擇一個新的零假設。
營銷人員對統(tǒng)計重要性的理解
好吧,但這在數(shù)字營銷領域意味著什么?
簡短的回答是:如果測試一個特定的變量沒有產生一個具有高度統(tǒng)計學意義的數(shù)據集,你的營銷費用和網站就有風險了。反之亦然。如果你沒有衡量每個結果的重要性,你可能會錯過一個寶貴的機會。
例如,在我們合作的一個大型電子商務網站上,我們的目標是提高用戶訪問男裝類產品頁面的速度。我們知道,人們越快找到他們喜歡的產品,他們就越有可能在第一次訪問時完成轉化過程。
我們希望有一個大的改進,當結果沒有顯示出大的變化時,我們相對失望。事實上,在更深入地分析數(shù)據之前,我們認為這根本不是一個好的方向。
空假設(當前狀態(tài)):過濾選項的樣式對搜索和查找所需產品的能力沒有影響。
替代假設(我們想要證明的):更強大的過濾選項將在幫助人們快速找到他們需要的東西并在首次訪問時轉換方面發(fā)揮關鍵作用。
正如你在上面看到的,我們變體體驗的轉換率提升不是很大。事實上,轉化率僅增加了微不足道的3.31%。
但是,當我們通過顯著性計算器傳遞這些數(shù)據時,我們發(fā)現(xiàn)我們的結果具有98%的統(tǒng)計顯著性。這意味著觀察到的差異只有2%的幾率是由誤差引起的。
考慮到這一點,這個測試有了全新的意義。雖然結果不夠大,不足以徹底改變用戶體驗,但通過計算數(shù)據集的重要性,我們可以依靠從測試中獲得的任何知識,并通過一組新的假設向前推進,從而進一步推動信封。
雖然3.31%并不算大,但對測試中顯示的改進充滿信心的能力意味著我們可以向前看,并計劃在未來6個月內帶來數(shù)萬美元的轉換提升。
沒有看到很高的意義?
在《哈佛商業(yè)評論》中,湯姆萊德曼回應了我們關于營銷中意義的真正價值的許多觀點。他說:
"如果你在尋找希格斯玻色子,你可能想要一個極低的p值,也許是0.00001。但如果你在測試你的新營銷理念是否更好,或者你的工程師設計的新鉆頭是否比你現(xiàn)有的鉆頭工作得更快,那么你可能會愿意接受更高的值,甚至可能高達0.25。"
所以,在你放棄這個有80%重要性的實驗之前,考慮以下幾點:
測試進行了多長時間?
如果它比普通顧客的購買周期短,那就把它放久一點,以后再檢查(就我個人而言,我從來不會在數(shù)據少于2周的情況下進行測試)
你的樣本有多大?
如果你的樣本少于1,000個訪問者,請仔細考慮是否要進行測試(每組幾千個訪問者總會減少樣本中的差異)。樣本越小,數(shù)據集內的方差自然就越大。如果你在處理低流量的頁面,試試這里的一些方法。
你的趨勢線是什么樣的?
如果你其中一種經歷的轉化趨勢持續(xù)優(yōu)于另一種——特別是如果差距隨著時間的推移而擴大——你可能走對了路。繼續(xù)調整和測試——你可能已經找到了真正能提高轉化率的東西。
同樣,如果你在等待一組數(shù)據準備好解釋,而"表現(xiàn)更好"的趨勢線是完全不穩(wěn)定的,那么在繼續(xù)走這條路之前要小心。
考慮你的最終目標
如果你在主頁上運行A/B測試,你可能會把底線收入作為你需要報告的指標之一。但是,如果整體轉換停滯不前或難以解釋,那么開始觀察微觀轉換(用戶進入下一步)以及宏觀轉換(本例中為購買)可能是有意義的。
這樣,如果你開始發(fā)現(xiàn)較小目標的重要性,你可以逐步測試轉化漏斗的不同部分,最終找到對最終目標影響最大的步驟。
結論
雖然許多測試會失敗,但在沒有進行一些基本計算來確定結果是否重要之前,任何分析都不能被認為是"完成"的。
在為新的商業(yè)策略、廣告設置或網站設計投入大筆資金之前,試著做一些快速計算。這是確保你知道自己前進的風險有多大的最好方法。因為不管一個變量是否能夠導致一個足夠大的結果來拒絕零假設,絕大多數(shù)的測試和變量都應該提供可以給你指明正確方向的信息。
而且,盡管在大學里這肯定不是最有趣的話題,你可能會發(fā)現(xiàn)計算重要性真的成為你作為營銷人員最實用的技能。
順便說一句,如果你想在設置自己的網站測試或評估結果方面得到幫助,請在這里或評論中告訴我。我很樂意幫忙!
你如何在你的網站測試中使用統(tǒng)計顯著性?這篇文章有助于回答你的問題嗎?請在評論中留下你的想法。
特雷弗安德森諾索爾
特雷弗的愛好包括積累戶外裝備、長篇播客和構建用戶行為策略。在他離開辦公室的時候,你很可能會發(fā)現(xiàn)他在抽肉,和他的愛犬在一起。
注:配圖為UCI設計公司作品
通過惠州包裝設計公司的精彩分享,設計師更輕松快捷地掌握惠州包裝設計公司分享的營銷與設計知識,幫助北京vi設計公司更好地服務好客戶 。