【干貨】從網(wǎng)易產(chǎn)品經(jīng)理筆試,教你如何做數(shù)據(jù)估算題
2016年網(wǎng)易產(chǎn)品實(shí)習(xí)中,有這么一道數(shù)據(jù)估算題:
估算今年全國(guó)通過(guò)網(wǎng)絡(luò)參加考研培訓(xùn)的人數(shù)?
這類題型主要考察:
- 邏輯思維能力:遇到問(wèn)題能否清晰有條理。
- 數(shù)據(jù)能力:對(duì)數(shù)據(jù)的關(guān)注度,是否重視日常的數(shù)據(jù)。
- 細(xì)節(jié)把握能力:是否注意分析中的細(xì)節(jié),結(jié)合實(shí)際情況去細(xì)化
要點(diǎn):
- 準(zhǔn)確的數(shù)據(jù)越多,估算越有根據(jù),也體現(xiàn)了應(yīng)聘者對(duì)數(shù)據(jù)的重視。
- 漏斗模型,注意每個(gè)環(huán)節(jié)的人員流失率。環(huán)節(jié)考慮的越多,對(duì)問(wèn)題的分析也更加透徹。
- 用戶分類和畫像。盡量結(jié)合用戶的使用場(chǎng)景,對(duì)用戶進(jìn)行分類,這樣數(shù)據(jù)也更貼合實(shí)際情況。
- 思路比結(jié)果重要。最終的數(shù)據(jù)可能不在一個(gè)級(jí)別,但是在有多種方案的情況下,通過(guò)不同方案的比較大致可以估算出一個(gè)量級(jí)??疾斓闹攸c(diǎn)是思維。
本題解答思路(供參考):
步驟1:做加法
(本階段不求正確,多多益善)
尋找準(zhǔn)確能夠獲得的數(shù)據(jù),從不同維度來(lái)尋找數(shù)據(jù),類似頭腦風(fēng)暴:
1.?提取關(guān)鍵字法:
可以通過(guò)去掉其中的一些形容詞,提取關(guān)鍵字來(lái)聯(lián)想
全國(guó)+考研:今年全國(guó)考研人數(shù)
網(wǎng)絡(luò)+培訓(xùn):今年全國(guó)網(wǎng)絡(luò)培訓(xùn)機(jī)構(gòu)數(shù),機(jī)構(gòu)收入數(shù),培訓(xùn)人數(shù)
2.?從人、地點(diǎn)、時(shí)間、錢幾個(gè)維度來(lái)尋找線索。
- 人:考研的人數(shù),培訓(xùn)老師的人數(shù)
- 地點(diǎn):高校數(shù),機(jī)構(gòu)數(shù)
- 錢:在線教育交易額,客單價(jià)。
3. 從提供端和需求端兩個(gè)維度
提供端考慮:機(jī)構(gòu)數(shù),機(jī)構(gòu)老師數(shù)。需求端:課程數(shù),學(xué)生數(shù)。
步驟2:做減法
從步驟1提取自己較為熟悉的數(shù)據(jù)且和目標(biāo)數(shù)據(jù)相關(guān)度更明顯的數(shù)據(jù)。目標(biāo)事件為考研培訓(xùn),直接參與的主體是教師和學(xué)生,我們不妨通過(guò)教師數(shù)目和學(xué)生數(shù)目來(lái)突破。
步驟3:方案分析
本例提取考研學(xué)生報(bào)名數(shù):170萬(wàn),大學(xué)教師數(shù)150萬(wàn)
3.1 由培訓(xùn)教師來(lái)計(jì)算
考研科目的培訓(xùn)主要集中在外語(yǔ),數(shù)學(xué),政治等科目。
英語(yǔ)教師、數(shù)學(xué)教師、政治教師累計(jì)占比:
一本院校:
計(jì)130所,平均每個(gè)學(xué)校英語(yǔ)(含小語(yǔ)種)教師60名,數(shù)學(xué)教師(基礎(chǔ)數(shù)學(xué))按50人計(jì),政治教師按40人計(jì)。每個(gè)老師平均按30個(gè)學(xué)生計(jì),可以帶學(xué)生,考慮到學(xué)生實(shí)際可能一個(gè)人報(bào)3門課,平均每人按報(bào)1.5門課計(jì)。平均每一百個(gè)老師有3個(gè)做培訓(xùn)。
得到:130x(60+50+40)x30x3%/1.5=1.17w
二本院校:
750所,平均每個(gè)學(xué)院英語(yǔ)老師(含小語(yǔ)種)教師35人,政治教師30名,數(shù)學(xué)教師計(jì)30人,每個(gè)老師平均按20個(gè)學(xué)生計(jì)(教師影響力認(rèn)為比一類院校差),可以帶學(xué)生,考慮到學(xué)生實(shí)際可能一個(gè)人報(bào)3門課,平均每人按報(bào)2門課計(jì)(認(rèn)為二本院校學(xué)生培訓(xùn)需求相對(duì)較強(qiáng))。平均每一百個(gè)老師有5個(gè)做培訓(xùn)(認(rèn)為二本院校教師時(shí)間相對(duì)充裕)。
得到:750x(35+30+20)x20x5%/2=3.18w
方案2合計(jì):1.17w+3.18w=4.35w
3.2 由考研學(xué)生來(lái)計(jì)算
按大學(xué)來(lái)分:一本院校研學(xué)生占總考研人數(shù)比50%,由于資源相對(duì)較多,集中在線下培訓(xùn),其中參加線上考研培訓(xùn)的比例按1%計(jì),二本院校考研人數(shù)占總考研人數(shù)比按40%計(jì)算,參加線上考研培訓(xùn)占考研人數(shù)的比例按3%計(jì)算,三本考研人數(shù)較少占總考研人數(shù)比計(jì)10%,參加線上培訓(xùn)的占考研人數(shù)比例計(jì)2%。
計(jì)算結(jié)果:170w x(0.5×0.01+0.40×0.03+0.10×0.02)=3.23w
步驟三 計(jì)算過(guò)程中的要點(diǎn)
要點(diǎn)1:漏斗模型:
每經(jīng)過(guò)一個(gè)環(huán)節(jié),數(shù)據(jù)都會(huì)打折,留存的百分比直接相乘得到結(jié)果。
方案1漏斗模型:
在頂端數(shù)據(jù)確定的情況下,漏斗本身實(shí)際存在的環(huán)節(jié)越多最終的誤差越大,分析時(shí)選擇的環(huán)節(jié)越多,數(shù)據(jù)越接近真實(shí)數(shù)據(jù)。最終的結(jié)果為漏斗底部數(shù)據(jù)乘以各個(gè)環(huán)節(jié)的留存百分比。
要點(diǎn)2:通過(guò)用戶畫像對(duì)用戶進(jìn)行細(xì)分。
根據(jù)學(xué)生考研院校的不同,分為一類本科和二類本科,根據(jù)教師所教的課程不同對(duì)教師進(jìn)行分類。分類原因是因?yàn)檫@些不同的用戶在不同的漏斗環(huán)節(jié)具有不同的流失率,有利于數(shù)據(jù)更加準(zhǔn)確。本例在答題時(shí)間充裕以及對(duì)考研情況非常了解的情況下,學(xué)生可以繼續(xù)細(xì)分為不同專業(yè)的學(xué)生,不同收入水平的學(xué)生,對(duì)于政治教師可以繼續(xù)根據(jù)教師的方向分類,例如和考研相關(guān)的馬克思主義理論教師從事培訓(xùn)的比例相對(duì)較高,可以和其他方向分開(kāi)計(jì)算。甚至可以根據(jù)年齡進(jìn)行細(xì)分,有經(jīng)驗(yàn)的較年長(zhǎng)的老師可能參加培訓(xùn)的比例更高等。
步驟四:交叉驗(yàn)證
本例中兩種計(jì)算方案最終數(shù)據(jù)大致相當(dāng),得到了一定的驗(yàn)證。
總結(jié)
主要的思路和流程如上圖:以上簡(jiǎn)要介紹了產(chǎn)品筆試面試中常遇到的估算題。最終的數(shù)據(jù)不一定可靠,但是思路是大致一樣的。功夫在平時(shí),我們只有多關(guān)注數(shù)據(jù),平時(shí)有意識(shí)對(duì)用戶進(jìn)行細(xì)分,才能更好的鍛煉思維。
作者:孫輝(微信號(hào)huihuishengwei),在校研究生,產(chǎn)品愛(ài)好者,創(chuàng)業(yè)團(tuán)隊(duì)產(chǎn)品經(jīng)理
本文由 @孫輝 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
你這思路有問(wèn)題,人家問(wèn)的是參加網(wǎng)絡(luò)培訓(xùn)
170萬(wàn)是16年考研人數(shù),首先應(yīng)該是考慮參加培訓(xùn)的人數(shù)占比吧(有一部分是完全自學(xué)的,屬于流失),再才是用戶細(xì)分,然后考慮線下培訓(xùn)與網(wǎng)絡(luò)培訓(xùn)各自占比,,,一點(diǎn)個(gè)人想法
看完題目,我想我是不是要轉(zhuǎn)行。
我有一個(gè)問(wèn)題:3.2中,170萬(wàn)是學(xué)生總?cè)藬?shù),(0.5×0.01+0.40×0.03+0.10×0.02)中,0.5、0.4、0.1分別是一本、二本、三本中考研的人數(shù)百分比,但是括號(hào)中并沒(méi)有一本、二本、三本占總考研人數(shù)的百分比~
170萬(wàn)是16年考研報(bào)名人數(shù),你去查一下就知道了
補(bǔ)充一下:剛剛的疑問(wèn)針對(duì)3.1方法
我也發(fā)現(xiàn)這個(gè)沒(méi)體現(xiàn)出網(wǎng)絡(luò)這個(gè)關(guān)鍵詞呀,不過(guò)作者的思路還是值得借鑒的
寫的挺好的,有個(gè)疑問(wèn),你這里是不是沒(méi)加入“網(wǎng)絡(luò)”這個(gè)關(guān)鍵詞???不是問(wèn)通過(guò)網(wǎng)絡(luò)參加考研培訓(xùn)的人數(shù)嗎?
是的。。。所以感覺(jué)有點(diǎn)虛?
這寫的有問(wèn)題
個(gè)人的思路:先得出16年本科畢業(yè)人數(shù)、考研人數(shù)。假設(shè)本科畢業(yè)人數(shù)為76w,考研人數(shù)為170w(網(wǎng)上找到的數(shù)據(jù))。得出平均100個(gè)畢業(yè)生有20個(gè)考研的比率。通過(guò)市場(chǎng)調(diào)查隨機(jī)20個(gè)考研生的網(wǎng)絡(luò)培訓(xùn)比例(可以調(diào)查2、3組,建立角色畫像)。假設(shè)3組20個(gè)研究生的線上培訓(xùn)平均為65%(用戶畫像進(jìn)行分類,這里可以對(duì)城市不同進(jìn)行細(xì)節(jié)分類),那么大概可以估算170w考研學(xué)生有大概110w個(gè)參加網(wǎng)絡(luò)考研培訓(xùn)。不知是否正確。
100個(gè)畢業(yè)生20個(gè)考研的,這咋得出來(lái)的?除了應(yīng)屆考研,還有往屆的(二戰(zhàn)三戰(zhàn)…N戰(zhàn)的)、社會(huì)人士考研的。
筆試完看見(jiàn)這個(gè),哎,早看到會(huì)好很多
思路開(kāi)拓了不少,滿滿干貨!
看完題目一臉蒙蔽,后天就要筆試了,有沒(méi)有大神可以線上指導(dǎo)
類似的題目還有估算一個(gè)城市的出租車公交車數(shù)量啦,估算全國(guó)打某個(gè)游戲的用戶總數(shù)啦之類的都可以納入到答主的這個(gè)解決體系里面來(lái)。概括一下答主的思路大概就是細(xì)化問(wèn)題+層層抽樣,從一個(gè)部分來(lái)估算整體,分了幾層之后做抽樣調(diào)查比整體就快捷多了。
思路挺好的,估計(jì)實(shí)際操作中需要比較準(zhǔn)確的用戶調(diào)研。 ??
費(fèi)米推理法。作者思路方向絕對(duì)是很棒的,不過(guò)那些各科目教師參與培訓(xùn)比率和學(xué)生平均報(bào)1.5門科目這些數(shù)據(jù)的獲取確實(shí)缺少調(diào)研,來(lái)自于經(jīng)驗(yàn)吧,需要進(jìn)一步論證,或者換個(gè)方向。
我最后做這個(gè)題的時(shí)候只有十分鐘,寫了5行左右就沒(méi)有時(shí)間了,也沒(méi)有寫完。我當(dāng)時(shí)是想從宏觀層面,如歷年的研究生報(bào)名人數(shù),錄取人數(shù),網(wǎng)絡(luò)用戶占比等。但是這樣的數(shù)據(jù)又沒(méi)有辦法查閱,所以如果自己去估計(jì)數(shù)據(jù)的話估計(jì)更加離譜。所以樓主的估算方法還是有不錯(cuò)的價(jià)值的
查查四年前和五年前的本科錄取人數(shù),得出一個(gè)增長(zhǎng)率,再查查去年的考研人數(shù),乘以增長(zhǎng)率,就得出今年的考研人數(shù)了
你這個(gè),隨便一個(gè)數(shù)據(jù)估算錯(cuò)誤,差距就大了。比如,平均每人按報(bào)1.5門課,這個(gè)數(shù)據(jù)確定?平均每一百個(gè)老師有5個(gè)做培訓(xùn),憑什么?這種數(shù)據(jù)都是在YY啊,沒(méi)有任何科學(xué)依據(jù)。而且,參加培訓(xùn)的人數(shù),和培訓(xùn)教師的人數(shù),也沒(méi)關(guān)系吧!
是的,結(jié)果很不精確。培訓(xùn)教師的數(shù)目,是來(lái)作為量級(jí)參考的。
問(wèn)題是幾乎每一個(gè)參考系數(shù)都是YY的,何來(lái)自信量級(jí)能正確?
你們是腦子不好使吧?做校招筆試哪來(lái)的精確數(shù)據(jù)?出這種題考察的根本就不是你能不能精準(zhǔn)的算的對(duì),因?yàn)楦静豢赡苡腥怂愕膶?duì)。別人是要考你在計(jì)算過(guò)程中每一步是不是符合邏輯,有沒(méi)有把該剔除的去掉該保留的保留。最后得出的數(shù)據(jù)根本就不重要。這里一個(gè)阿貓一個(gè)qingtongli一直糾結(jié)數(shù)據(jù)準(zhǔn)確性,是學(xué)數(shù)學(xué)學(xué)傻了?
這個(gè)思路不敢茍同
你這個(gè)整的太復(fù)雜了,一上來(lái)哪有這么多時(shí)間,其實(shí)這里面只需要關(guān)注2014年,2015年的4個(gè)數(shù)據(jù)就行了。分別是2014、2015年的在大學(xué)本科畢業(yè)生的總?cè)藬?shù),參加考研的人數(shù),錄取人數(shù),參加網(wǎng)絡(luò)培訓(xùn)的總?cè)藬?shù)(發(fā)放一份調(diào)研問(wèn)卷,調(diào)研一下已經(jīng)考上研究生的同學(xué),他們有多少人參加的網(wǎng)絡(luò)培訓(xùn),得到一個(gè)百分比)。通過(guò)2104,2015本科畢業(yè)生的總?cè)藬?shù),參加考研的人數(shù),錄取人數(shù),參加網(wǎng)絡(luò)培訓(xùn)的總?cè)藬?shù)這四組數(shù)據(jù),分別得到四個(gè)百分比,得到他們之間的一個(gè)關(guān)系,然后查閱一下2016年將要畢業(yè)的大學(xué)本科畢業(yè)有多少人,通過(guò)2014年,2015年的比較數(shù)據(jù)就能比較精確的得到2016年大概會(huì)有多少同學(xué)會(huì)參加網(wǎng)絡(luò)在線培訓(xùn)。說(shuō)說(shuō)你分析的問(wèn)題,大學(xué)教師的多少和考研人數(shù)的多少?zèng)]得半毛錢關(guān)系,一個(gè)班50人也是教,40人也是教。你所說(shuō)的占比1%,2%的依據(jù)是什么,數(shù)據(jù)可靠嗎?你怎么去統(tǒng)計(jì)這部分?jǐn)?shù)據(jù),所以你這里面沒(méi)有考慮數(shù)據(jù)統(tǒng)計(jì)的正確性,既然這樣的話,你得到的數(shù)據(jù)的可靠性就會(huì)很差,說(shuō)白了,一堆很水的數(shù)據(jù)。所以結(jié)論就是好木匠不一定要用尺子,好司機(jī)開(kāi)車的時(shí)候不是還要背交通法規(guī)。
謝謝關(guān)注。1%是根據(jù)個(gè)人經(jīng)驗(yàn),是沒(méi)有依據(jù)。你說(shuō)的方法挺好的,可是可能沒(méi)有往年的網(wǎng)絡(luò)在線考研培訓(xùn)數(shù)據(jù)。
不明白層主說(shuō)的四個(gè)百分比得出他們之間的關(guān)系是什么意思。
——還有實(shí)際上是調(diào)研前三年的數(shù)據(jù)。不僅要算增長(zhǎng)率來(lái)推算數(shù)值。還要考慮增長(zhǎng)率變化值。
層主你這個(gè)直接拿到往年參加網(wǎng)絡(luò)培訓(xùn)的總?cè)藬?shù)就是開(kāi)啟作弊模式了好嘛。。。這樣的話直接比例就出來(lái)了,不符合這道題的初衷了吧。
? ? 最后做這題的時(shí)候只有3分鐘了 ??
時(shí)間規(guī)劃和進(jìn)度控制也是產(chǎn)品人重要的能力,拿到題目后可以大致估算一下每個(gè)題花的時(shí)間,控制好節(jié)奏。 ??
完全沒(méi)答對(duì),主要是時(shí)間根本不夠 ?? ?? ??
沒(méi)有標(biāo)準(zhǔn)答案,主要是思路。 ??