如何七周成為數(shù)據(jù)分析師18:Python的新手教程
本文是《如何七周成為數(shù)據(jù)分析師》的第十八篇教程,如果想要了解寫作初衷,可以先行閱讀七周指南。溫馨提示:如果您已經(jīng)熟悉Python,大可不必再看這篇文章,或只挑選部分。
Python是近年來最火爆的語言,已經(jīng)作為數(shù)據(jù)分析和機器學習的首選語言之一。
Python雖然被詬病不夠快,但足夠靈活和易上手。Python教程主要圍繞數(shù)據(jù)分析展開,所以技術(shù)原理這類內(nèi)容會略過,可以認為這是一篇重應用的課程。
想學會一門語言不是一朝一夕的事情,若大家想成為技術(shù)型的數(shù)據(jù)分析師,或者未來往數(shù)據(jù)挖掘發(fā)展,建議你要比文章內(nèi)容學得更深。所有的代碼最好都手打一遍,這是最有效的學習方式。
數(shù)據(jù)分析環(huán)境
Python的編寫環(huán)境,用Anaconda足矣。Anaconda是專業(yè)的數(shù)據(jù)科學計算環(huán)境,已經(jīng)集成絕大部分包和工具,不需要多余的安裝和調(diào)試。
Python版本建議3.0以上,現(xiàn)在最新版本是3.6,不要選擇2.7的版本,否則你會被無盡的中文編碼問題困擾。
Anaconda在官網(wǎng)continuum.io/downloads 下載,選擇最新版本,約400MB。
完成安裝后,Win版本會多出幾個程序,Mac版本只有一個Navigator導航。數(shù)據(jù)分析最常用的程序叫Jupyter,以前被稱為IPython Notebook,是一個交互式的筆記本,能快速創(chuàng)建程序,支持實時代碼、可視化和Markdown語言。
點擊Jupyter進入,它會自動創(chuàng)建一個本地環(huán)境localhost。
點擊界面右上角的new,創(chuàng)建一個python文件。
開始你的Python
界面上部是工具欄,編輯撤回運行等,下面是快捷操作,大家以后會熟悉的。頁面正中便是腳本執(zhí)行的地方,我們輸入自己第一行代碼吧:
(我就不用hello world)灰色框是輸入程序的地方,回車是換行,shift+回車執(zhí)行灰色區(qū)域的代碼,它的結(jié)果會直接在下面空白處出現(xiàn)。這就是Jupyter交互式的強大地方,將Python腳本分成片段式運行,尤其適合數(shù)據(jù)分析的摸索調(diào)整工作。
這里的print叫函數(shù),和excel的函數(shù)同理,是程序執(zhí)行的主體,負責將輸入轉(zhuǎn)化成輸出(函數(shù)留在下一篇細講)。這里將hello qinlu這段文字輸出。新手可能會奇怪為什么要加引號,這種用引號括起來的文字在程序中叫字符串。
Python是一門計算機語言,它的邏輯和自然語言不一樣,編程語言的目的是執(zhí)行任務,所以它不能有歧義。為了規(guī)避各種歧義,人們創(chuàng)造了語法規(guī)則,只有正確的語法,才能被轉(zhuǎn)換成CPU執(zhí)行的機器碼。
先了解Python語法中的數(shù)據(jù)類型。計算機最開始只被用于數(shù)值運算,后來被賦予了各種豐富的數(shù)據(jù)類型。
上面兩個是小學生都會的四則運算,在計算機語言中可沒有那么簡單。它涉及了兩個數(shù)值類型,整數(shù)int和浮點數(shù)float。整數(shù)和浮點數(shù)在計算機內(nèi)部存儲的方式是不同的,我們不用知道具體原理,明確一點,整數(shù)運算是永遠精確的,浮點運算則可能有誤差。
兩種數(shù)據(jù)類型也可以互換,通過int函數(shù)和float函數(shù)。
有了數(shù)值,必然有文本,程序中叫字符串,用英文引號括起來表示。單引號和雙引號沒有區(qū)別,所以”qinlu”和’qinlu’是等價的,引號是邊界,輸出的時候不會包含它。當字符串內(nèi)本身包含引號時,也不影響使用。
需要注意的是,不論單引號還是雙引號,一旦混用很容易出現(xiàn)錯誤。因為程序并不知道它是字符串的邊界還是符號。
解決方法有兩種,一種是使用三引號,三引號代表整體引用,而且包含換行。第二種是引號前面加\,它是轉(zhuǎn)義字符,表示這個引號就是單純的字符。
三引號也可以用來注釋,通常是大段的文字解釋,如果一句話,我們更習慣用#,#后面的內(nèi)容均不會作為程序執(zhí)行。
時間是特殊的數(shù)值類型,它將結(jié)合datetime模塊講解。
還有兩個常見的數(shù)據(jù)類型,布爾值和空值。布爾值是邏輯判斷值,只有True和False。
布爾值在IF語句和數(shù)據(jù)清洗中經(jīng)常使用,利用其過濾。布爾值能和布爾值運算,不過這里是and、not、or作為運算符,Ttue and True = True,F(xiàn)alse and True = False,F(xiàn)alse and False = False,not True = False,True or False = False等。
空值是一個特殊的值,表示為None,None不等于0,0具有數(shù)學意義而None沒有,None更多表示該值缺失。
整數(shù),浮點數(shù),字符串,布爾值,空值就是Python常見的數(shù)據(jù)類型。Python3對中文的支持比較友好,所以大家可以用中文作為字符串試一下print。
數(shù)據(jù)類型構(gòu)成了變量的基礎,變量可以是任意的數(shù)據(jù)類型。想要用變量,必須先賦予變量一個值,這個過程叫賦值。
我首先給a賦予了一個整數(shù)值1,然后改變它為字符串a(chǎn)bc,變量在Python中沒有固定的數(shù)值類型,這是Python最大的優(yōu)點,所以它在數(shù)據(jù)分析中很靈活。這也是它被稱為動態(tài)語言的原因,相對應的叫靜態(tài)語言。
Python是大小寫敏感的語言,所以a和A是有區(qū)別的,這點請牢記。另外變量名盡可能使用英文,不要拼音,英文的可讀性是優(yōu)于拼音的。
變量有兩種拼寫風格,一種叫駝峰,一種叫下劃線,以用戶ID為例。駝峰命名法為userId,以一串英文詞語user和id組成變量,第一個詞語的首字母小寫,第二個詞語開始的首字母均大寫。下劃線命名法為user_id,全部小寫,用_分割單詞。
一個變量的值可以被賦予另外一個變量,如果b變量之前有另外一個值,那么會被1覆蓋。呈從上而下的執(zhí)行關(guān)系。
初看a = a + 1好像有邏輯問題,其實這涉及到了程序執(zhí)行的先后順序,程序是先計算a+1的值得到2,然后將其賦予(覆蓋)了a。等號右邊的計算先于左邊,這是從右到左的邏輯關(guān)系。
有變量,自然有常量,常量是固定不變的量,可是在Python中沒有真正意義的常量,一切皆可變,它更多是習慣上的叫法,即一旦賦值,就不再改變了。
Python的基礎數(shù)學運算符號有+,-,*,/,//,%。前面四個就是加減乘除,其中除法的結(jié)果一定是浮點數(shù)。后面兩個符號是除法的特殊形式,//代表除法中取整數(shù),%代表除法中取余數(shù)。
到這里,新手部分已經(jīng)講解完成。因為考慮到大家的基礎不一致,故早期內(nèi)容并不難,后續(xù)學習難度才會逐漸遞增。下一章講解數(shù)據(jù)結(jié)構(gòu)。
相關(guān)閱讀
互聯(lián)網(wǎng)數(shù)據(jù)分析能力的養(yǎng)成,需一份七周的提綱
如何七周成為數(shù)據(jù)分析師01:常見的Excel函數(shù)全部涵蓋在這里了
如何七周成為數(shù)據(jù)分析師02:Excel技巧大揭秘
如何七周成為數(shù)據(jù)分析師03:手把手教你Excel實戰(zhàn)
如何七周成為數(shù)據(jù)分析師:Excel技巧之甘特圖繪制(項目管理)
如何七周成為數(shù)據(jù)分析師:Excel技巧之打造多級菜單
如何七周成為數(shù)據(jù)分析師04:數(shù)據(jù)可視化之經(jīng)典圖表合集
如何七周成為數(shù)據(jù)分析師05:數(shù)據(jù)可視化之打造升職加薪的報表
如何七周成為數(shù)據(jù)分析師06:數(shù)據(jù)可視化之手把手打造BI
如何七周成為數(shù)據(jù)分析師07:快速掌握麥肯錫的分析思維
如何七周成為數(shù)據(jù)分析師08:如何建立數(shù)據(jù)分析的思維框架?
如何七周成為數(shù)據(jù)分析師09:寫給新人的數(shù)據(jù)庫指南
如何七周成為數(shù)據(jù)分析師10:SQL,從入門到熟練
如何七周成為數(shù)據(jù)分析師11:SQL,從熟練到掌握
如何七周成為數(shù)據(jù)分析師12:解鎖數(shù)據(jù)分析的正確姿勢(上)
如何七周成為數(shù)據(jù)分析師13:解鎖數(shù)據(jù)分析的正確姿勢(下)
如何七周成為數(shù)據(jù)分析師14:概率論的入門指南
如何七周成為數(shù)據(jù)分析師15:讀了本文,你就懂了概率分布
如何七周成為數(shù)據(jù)分析師16:數(shù)據(jù)分析必須懂的假設檢驗
如何七周成為數(shù)據(jù)分析師17:最全的運營數(shù)據(jù)指標解讀
#專欄作家#
秦路,微信公眾號ID:tracykanc,人人都是產(chǎn)品經(jīng)理專欄作家。
本文由 @秦路?原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
按您文中說的在官網(wǎng)下載Windows Anaconda 3.6后,只有一個Anaconda Prompt,其他的都沒有怎么辦???
已經(jīng)解決了 關(guān)掉殺毒軟件就可以~~安裝后運行也要關(guān)閉殺毒軟件