特訓營·第1計劃·(階段一)
標準庫,擴展庫,運算符,表達式,字符串、轉義字符,字符串的輸出和輸入,訪問字符串中的值,字符串內(nèi)建函數(shù); 列表,包括列表訪問,列表運算,深拷貝/淺拷貝,列表常用的方法; 字典,集合,條件表達式,選擇結構,包括while循環(huán),break語句,forin循環(huán),range函數(shù),continue語句; 函數(shù)參數(shù),變量作用域,lambda,生成器;類的定義,使用,數(shù)據(jù)成員,成員方法,特殊方法,運算符重載; numpy,包括NumPy數(shù)學函數(shù),NumPy統(tǒng)計函數(shù),NumPy矩陣庫(Matrix),NumPy排序、條件刷選函數(shù),NumPy線性代數(shù),數(shù)組運算,矩陣運算,scipy,pandas,如Pandas數(shù)據(jù)結構,Pandas數(shù)據(jù)幀(Dataframe),Pandas面板,包括Pandas基本應用,Pandas描述性統(tǒng)計,Pandas函數(shù)應用,Pandas重建索引,Pandas迭代,Pandas統(tǒng)計函數(shù); |
特訓營·第2計劃·(階段二)
Pandas讀取數(shù)據(jù),scikit-learn訓練與測試模型; 評估模型性能的指標;交叉驗證(把給定的數(shù)據(jù)進行切分,將切分的數(shù)據(jù)集分為“訓練集”和“驗證集”(假設其中4份為train,1份為validation),在此基礎上循環(huán)選取進行訓練和驗證。曲線判斷過欠擬合,用網(wǎng)絡搜索訓練模型;測試NumPy、pandas技能的掌握;測試對模型評估與驗證的理解; |
特訓營·第3計劃·(階段三)
分類與回歸的區(qū)別,學習使用線性回歸來做預測; Iris經(jīng)典愛麗絲,愛麗絲進化與文本矢量化,AI操作流程,數(shù)據(jù)切割函數(shù),Iris愛麗絲分解,線性回歸算法,邏輯回歸算法;樸素貝葉斯原理,樸素貝葉斯算法,KNN近鄰算法,隨機森林算法,構建垃圾郵件分類器; 決策樹算法,GBDT迭代決策樹算法,SVM向量機,SVM-cross向量機交叉算方法,神經(jīng)網(wǎng)絡算法,MLP神經(jīng)網(wǎng)絡算法,MLP_reg神經(jīng)網(wǎng)絡回歸算法,探索泰坦尼克號乘客存活模型;支持向量機以線性分離數(shù)據(jù); 非線性可分的數(shù)據(jù)上來訓練SVM;boosting提升傳統(tǒng)方法;Adaboost,CCPP數(shù)據(jù)集,數(shù)據(jù)集切割,讀取CCPP數(shù)據(jù)集,機器學習統(tǒng)一接口,批量調用機器學習算法,一體化調用,存儲算法模型,批量存儲算法模型,批量加載算法模型,機器組合算法;監(jiān)督學習測試題; |
特訓營·第4計劃·(階段四)
聚類算法,k-means對數(shù)據(jù)聚類;k-means,K均值聚類算法是先隨機選取K個對象作為初始的聚類中心。計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給距離它最近的聚類中心,對電影評分聚類; 單連接聚類法、層次聚類法,通過某種相似性測度計算節(jié)點之間的相似性;DBSCAN,Density-basedSpatialClusteringofApplicationswithNois是一個比較有代表性的基于密度的聚類算法;高斯混合模型、高斯概率密度函數(shù)、正態(tài)分布曲線及 相關示例; 通過案例學習特征縮放;降維,PCA的原理(PCA降維原理是基于訓練數(shù)據(jù)集X的協(xié)方差矩陣C的特征向量組成的K階矩陣U,XU得到X的k階降維矩陣Z。主要原理用的是協(xié)方差矩陣C是一個實對角矩陣的性質和使用場景; 特征臉方法、SVM臉部識別,使用預處理來提取更有意義的特征。這里使用主成份分析來提取150個基本元素,然后將其提供給支持向量機分類器,將這個預處理和分類器打包成管道;隨機投影(隨機投影的理論依據(jù)是J-LLemma,公式的核心思想總結一句話就是:在高維歐氏空間里的點集映射到低維空間里相對距離得到某誤差范圍內(nèi)的保持,獨立成分分析,Lab學習應用這些方法;非監(jiān)督學習測試題; |
特訓營·第5計劃·(階段五)
深度學習,這是機器學習中一種基于對數(shù)據(jù)進行表征學習的方法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區(qū)域等,而使用某些特定的表情識別,包括softmax、one-hotencoding和crossentropy感知器,與梯度下降; 神經(jīng)網(wǎng)絡結構,通過backpropogation來訓練網(wǎng)絡優(yōu)化神經(jīng)網(wǎng)絡,如regularization與dropout使用Keras分析IMDB電影數(shù)據(jù);卷積神經(jīng)網(wǎng)絡原理,卷積神經(jīng)網(wǎng)絡,包括Convo-lutional,NeuralNetworks,CNN,是一類包含卷積計算且具有深度結構的前饋神經(jīng)網(wǎng)絡,F(xiàn)eed-forward、NeuralNetwo,是深度學習(deeplearning)的代表算法之一、圖像識別、keras、 遷移學習;深度學習在癌癥(如皮膚癌)檢測,將近13萬張可用的皮膚病變圖像,覆蓋了2000多種不同的疾病類型。他們使用這一數(shù)據(jù)集創(chuàng)建了圖像庫,并將其作為原始像素提供給算法,每個像素都帶有標簽,描述了相關疾病的附加數(shù)據(jù)。研究人員訓練算法總結出圖像里的模式,也即發(fā)現(xiàn)疾病經(jīng)由組織傳播在外觀上所遵循的規(guī)則; |
特訓營·第6計劃·(階段六)
強化學習(reinforcementlearning),又稱再勵學習、評價學習,是一種重要的機器學習方法,在智能控制機器人及分析預測等領域有許多應用,與OpenAIGym的基礎;馬爾科夫決策過程策略,基于馬爾可夫過程理論的隨機動態(tài)系統(tǒng)的優(yōu)決策過程; 馬爾可夫決策過程是序貫決策的主要研究領域,它是馬爾可夫過程與確定性的動態(tài)規(guī)劃相結合的產(chǎn)物,又稱馬爾科夫型隨機動態(tài)規(guī)劃,屬于運籌學中的支,推到Bellman方程; 迭代策略評估、策略改進、策略迭代和值迭代;蒙特卡洛預測,也叫蒙特卡羅(MonteCarlo)方法,又稱隨機抽樣或統(tǒng)計試驗方法,控制方案、greedy算法、epsilon-greedy算法;Sarsa、Q-Learning、預期Sarsa; 解決OpenAIGym(OpenAIGym是一個用于開發(fā)和比較RL算法的工具包,與其他的數(shù)值計算庫兼容,如tensorflow或者theano庫?,F(xiàn)在主要支持的是python語言,以后將支持其他語言)的Taxi-v2任務;傳統(tǒng)算法適用于連續(xù)空間;深度神經(jīng)網(wǎng)絡將強化學習方法擴展到復雜問題;基于策略的方法優(yōu)化優(yōu)策略;基于價值、基于策略的方法,解決具有挑戰(zhàn)性的強化 學習問題;強化學習相關的測試題; |
預約后,免費為您匹配專業(yè)課程