統計分析為什麼要引入時間
① 在統計學中,時期和時點是怎麼回事
如何確定時期和時點?
時期是反映一段時間內的數量變化,而時點是反映一個時刻上的數量變動的。
② 網路數據統計分析筆記|| 動態網路
前情回顧:
Gephi網路圖極簡教程
Network在單細胞轉錄組數據分析中的應用
網路數據統計分析筆記|| 為什麼研究網路
網路數據統計分析筆記|| 操作網路數據
網路數據統計分析筆記|| 網路數據可視化
網路數據統計分析筆記|| 網路數據的描述性分析
網路數據統計分析筆記||網路圖的數學模型
網路數據統計分析筆記|| 網路圖的統計模型
網路數據統計分析筆記|| 網路拓撲結構推斷
網路數據統計分析筆記|| 網路圖上的過程建模與預測
動態網路(Dynamic Networks)是指加上時間戳的網路,包含時序網路和切片網路兩種類型。其中時序網路是指網路從初始狀態不斷演化的情況。切片網路要簡單一些,就是由一組切片構成的動態網路。
動態網路的特徵化
動態網路建模目前尚且不易。因為引入時間,新問題中的組合爆炸也是一個重要原因。
https://www.hu.com/question/265008836
https://zhuanlan.hu.com/p/148190973
https://www.ccs.neu.e/home/rraj/Talks/DynamicNetworks/DYNAMO/IntroDynamicNetworks.pdf
https://briatte.github.io/ggnet/
https://link.springer.com/referencework/10.1007/978-1-4614-7163-9
https://blog.csdn.net/tanzhangwen/article/details/8262017
③ 統計分析報告如何撰寫
一名統計部門工作人員,必須要具備一定的綜合文字能力,工作中要經常撰寫分析報告、調研文章等。下面,主要是我個人多年來在分析報告寫作和修改中的一些體會和思考。
一、為什麼要寫統計分析
(一)統計職能的需要。統計分析是統計工作中的重要一環;統計部門的主要職能是服務,而統計分析最能體現統計服務的質量和水平;市場經濟條件下,各級黨委、政府以及社會各界對統計分析的要求空前提高。從整個統計工作來講要抓的工作很多,但核心的工作主要是兩件事情。一是生產數據,二是解讀數據。各個專業、基層、企業,都是數據生產的環節、組成部分。在此基礎上,就是要數據解讀。數據出來後,數據反映了什麼?經濟發展的走勢如何?有什麼苗頭性問題?這就需要我們進行分析解讀,為黨政領導決策提供更好的服務。統計部門要成為智庫,也就是能夠獨到的分析解讀數據,提出有價值的建議。我們對經濟社會的發展,要比別人看得早、看得廣、看得深,要有獨到之處,為領導決策和經濟社會的發展出謀劃策。
(二)素質提升的需要。一是立身之本:深化認識,提高能力;二是發展之基:全面發展,助推進步。統計人員素質就分析來說,我認為要有敏銳的觀察力,要有強大的承受力,要有統計專業能力,要有良好的文字功力等。
二、寫什麼樣的統計分析
(一)要有鮮明的特色。什麼是統計特色?最大的特色就是用數據說話。統計分析雖然是從數據入手,但在分析過程中始終是定量分析與定性分析相結合的。統計分析是把相關的指標數值聯系起來,對被研究現象進行全面、系統的分析。因為工作關系,我相對來說接觸其他部門的材料比較多,總的體會是,教授專家寫的課題理論性強,聯系實際比較少,總感覺像在看教科書,統計分析呢寫實的比較多,理論相對不足,缺乏理論的高度,有時看了就比較平實,檔次感覺不高,所以我們追求的目標應該是統計分析精品,要求既有實際的把握,又有理論的高度,而且要在時效性,針對性上多下工夫。按湖州的土話,不能做“瞎子、聾子、啞子”。也就是要看得懂數據、聽得到聲音、說得上話語。
(二)要有規范的流程。一般在考慮時要按以下流程:首先是選准主題—開頭,其次是圍繞主題定結構—框架,第三是呼應主題收好尾—結尾,最後是反復修改—審核定稿。
選題---主題必須要鮮明,標題要醒目,開頭要簡明。常說的“三點式”---關注點、矛盾點、發生點,可以圍繞熱點、難點問題,領導關注點,上級要求,發生點一般是指,新情況、新問題,新特點、新趨勢、新聯系等,也可以從自己拿手的領域來確定。
框架---一般來說,包括基本情況的概述,點出現狀中的亮點,分析存在的問題,論述發展的趨勢,提出相關的建議。
結尾---對全文的一個歸納總結,與開頭要呼應。得出結論也好,預測趨勢也好,提出建議也好都可以作為結尾來寫。
修改---從全文看,主題怎麼樣,內容與主題是否匹配,結構是否嚴謹,材料是否准確,數據是否准確,語言是否規范。修改是必須的,一定要認真,仔細,反復推敲。
(三)要有獨到的角度。什麼樣的角度去觀察,分析,切入點是什麼,這個要看你對整個材料的掌控能力,可能切入點不同,同樣的題目,寫出來的效果是完全不同的。比如2014年我執筆撰寫的市政府咨詢委的2個課題,一個是關於市區經濟發展的,當時課題組討論時要求2003年開始對市區經濟發展做1個比較,回答慢不慢?哪裡慢?哪裡快?然後再找出為什麼慢?問題是什麼?再提出怎麼發展?發展的措施與對策。給我1個月時間交貨。另一個是湖州與嘉興市的比較分析,比較的角度是非常多的,經濟的,社會的,總量的,結構的,人均的,具體用那些指標等,這些都要有個總體的把握,最後2篇課題報告都得到了市裡主要領導的批示,被評為當年優秀咨詢課題報告。具體等會再講。
(四)幾個基本的要求。優秀的統計分析有一定的標准,所謂標准各人的理解不盡相同,但一般來說,我認為從內容上來說,有5個方面:1.准確性:觀點數據要准確2.及時性:題材要及時,緊扣時局熱點3.實踐性:要貼近實際,反映實際4.思想性:要有自己獨特的視角和觀點5.可讀性:內容文字要通俗易懂。從形式上來說,有6個方面:1. 主題要鮮明2. 標題要確切、簡明、醒目3. 觀點與材料要統一4. 結構要嚴謹5. 文字要力求准確、簡潔、通俗易懂6. 要文、圖、表並用,各顯其長。
(五)幾個常見的問題。影響統計分析質量的問題很多,一般來說以下情況經常會出現。1. 脫離統計數字談問題。統計分析是用統計數字說話的。2. 數字文字化。一是缺乏分析的單純數字羅列;二是統計分析不是對統計報表做解釋性的說明。3. 重點不突出,分析方法單一。對於重點原因的分析要突出,要深入,要透切,對於非主要原因要略做交待,對於影響較小的原因可一筆帶過或者省略。4. 缺乏典型材料的補充,大量使用平均數,但平均數在說明情況時卻掩蓋了先進與落後的差別。5. 長篇大論,套話充斥。6. 建議提得不具體、不實際,缺乏可操作性。7. 重大問題,趨勢性問題反映滯後。8.理論性的,數據模型等太多,像是學術性的文章。
三、怎麼樣寫好統計分析
根據我自身的工作體會,主要有以下幾個方面:
(一)准備工作要充分
1.收集各種相關數據。數據最重要,含近期的,歷史的,橫向的各種數據。這里特別要注意歷史資料的可比性,和時效性。作為一個統計人員,那些數據有,那些沒有,在什麼地方、部門、專業上去收集,自己要瞭然於心,這樣才能提高工作效率。
2.查找各種參考資料。相近題材的文章,觀點,最新的動態等,大政方針政策等要做參考。事先在網上收集同類研究方向的報告比較實用,很多拿來可以用。比如有些最新的改革措施,如供給側改革,我們平時學習中接觸不多,但網上很多解讀,可以收集相關資料和市裡的一些工作部署結合起來。
3.梳理好自己的觀點。有了數據,參考資料,就可以梳理出你自己的一些判斷和觀點,以及相應的論據。一定要結合湖州的實際。
4.確定分析提綱框架。框架有了,寫起來就比較順手,可以隨時進行補充完善,架構我感覺是可以隨時變動的,有的可能你當時收集的數據資料是這樣的,可能新的數據又變了,框架也要進行調整。但大的變動應該不會有。按原先的設計去走。主要是當前數據質量的確長期觀察有時會發現很多問題,這不是經濟規律,可能有人為因素在裡面,所以有時也得選擇性考慮這些客觀的東西,以便於和主題對應。
(二)基本技能要掌握
1.怎麼化解觀點與數據的矛盾?經常碰到這種情況,觀點是對的,但數據不支持,有的甚至相背,很苦惱。這說明你是在思考問題的,知道有問題,怕的是不看數據,拿來就用,標題和數據不匹配不協調,這個要特別提醒大家。碰到了,怎麼去應對。這要很多的技巧和相關的業務知識。最怕是直接用了數據,但最後和觀點不符合。那麼問題來了,你是用數據支撐你的觀點,還是因為數據找到論點?關於這個問題其實都是對的,事實我這么多年下來,在分析問題時,用各種數據基本都能做到自圓其說,一般來說,我們需要先有個輪廓,然後對比數據是否支持,然後修改觀點。(舉例)前面講到的服務業比重下降問題,但當年服務業增速高於GDP,所以可以用貢獻率的角度來論證,再加上內部行業發展比較快的數據支撐,就可以勾畫出服務業發展的態勢。比如說,工業經濟效益,今年的利潤、利稅增幅都比較高,但經濟效益是不是非常好?這個就要用一些其他的數據來說明,比如是不是有去年基數的問題?是不是個別行業拉動的問題?也可以去看資產貢獻率指標的變化,也可以從增加值率偏低問題去觀察,湖州增加值率低也是客觀存在的問題,至於用什麼數據,就要有取捨。再比如,投資率的問題,一年反應可能有偏差,你可以去計算一個時期的平均投資率來觀察,投資效果系數也同樣,當年可能很低,大大低於全省水平,但5年平均可能比全省好。現在一般用恩格爾系數反應生活質量高低,但個別年份可能和上年比是上升的,你總不能說我們的生活質量在下降吧。
2.怎麼應對數據資料的空缺或者口徑變化?這種事情很多時候會發生,要學會運用統計方法來進行處理,不能因為個別數據,影響大局,搞適當的評估、預測、推算是完全可以的,最近我寫的市區發展課題中要用到民營經濟的發展水平。原來2005年-2011年時搞過推算,現在要調整為2013年,全市和市區進行比較,總的是市區慢於全市,但這2年市區發展勢頭比較好,數據會有大的變化,按相關資料推算就可以,就當做是研究性課題中用一下,不用太精準的,所以我有時會叫專業上大概算了個數據,比如全社會從業人員數據,一、二、三產業分組有些年份變化很大,這肯定是有問題的,本身很多數據是推算的,那麼有時應用起來你也可以大膽的推算,當然必須要有統計專業知識,不算隨便算。像類似這些情況的數據,我們在寫報告時,可以帶一句,根據相關資料的測算,什麼指標,完成多少。。。。不要太糾結。有時口徑變化了,你要了解新老口徑的變化情況,對數據要適當處理,像投資,這幾年口徑變化還是比較大的,這里有一條你記著,就是相對數基本不變的原則來處理。差距不大的就直接拿來用,加個標注就可以了。像全體居民收入就近幾年的數據是有的,上次我寫GDP含金量的一篇分析,需要10年左右的時間來比較,那麼我就按城市化率,各年的城鄉居民收入來推算,得出各年度收入和GDP的比例。平時也可以多看看,研究一下年鑒資料的內容,更多地掌握資料的來源渠道。這里我順便考大家幾個問題,一是5年的平均投資率怎麼計算的?5年的平均投資效果系數是怎麼計算的?二是長三角16個城市,你知道了各市的GDP(現價),以及可比價的增速,那麼16城市總的平均增長率是怎麼算的?同樣的規上工業增加值增速怎麼算?所以數據的計算和應用其實很多用到統計原理知識,基本的統計學原理大家一定要掌握,不然你很難靈活應用和處理大量的數據。
3.怎樣看待統計分析的“拿來主義”?不可否認,在實際撰寫分析報告中,或多或少都要用到別人在分析中的一些觀點,尤其是統計分析,很多是季度、年度分析報告,題目幾乎是一致的,適當拿來應用是完全可以的,但不能生搬硬套,消極模仿,整篇整段挪為己用。有人說過,在寫作中重復某一篇優秀文章—中級水平,概括某幾篇優秀文章—高級水平,匯集各家觀點的基礎上形成自己獨到的見解—專家水平。對於新參加工作不久的幹部,或者平時寫的不多的專業人員,克服急於求成的思想,練好基本功,先寫好信息、簡單的分析,再逐步學會寫課題報告。走出“消極模仿-積極模仿-自主創新”的路子,多學習、多思考、多練習,堅持數年,定有成效。對於現在已經有較好基礎,但對繼續提高有困惑或者信心不足的專業人員,我要說的是一定要跳出本專業的框框,多用自己專業外的信息資料,訓練自己深入思考的能力,提高分析的理論層次。
4.怎樣對文章做最後的修改?一是細節問題。包括標點符號,大小寫,數據計量單位,錯別字等。二是小標題。這個問題一般人不注意,寫到哪是哪,有些可能前面1段有標題,後面就忽視了,看不出什麼標題,有些前面2行的,後面變1行了等等,大家有沒注意,我現在給大家改小標題的比較多,別看小小的次標題,有時領導看報告沒時間全看,他是先看標題再看內容的,有些看了標題,沒興趣的話,裡面內容根本就不看,所以我是反復推敲的,有時為了字數對應,可謂絞盡腦汁。三是問題重復。有時擺問題容易在裡面重復概述,引用的數據也會重復,一定要修改過來。四是數據和觀點不匹配。有時用的數據多了,突然最後審核時發現數據其實和觀點不一致。五是建議空泛。最後如果感覺沒深度,最後的建議泛泛而談,和前面的分析脫離,寧可去掉。
四、分析寫作實例。
前面簡要的講了三個方面的大問題,最後主要結合自己最近幾年寫的課題報告,從選題、框架結構、文章脈絡等方面和大家做個交流。關於選題,我感覺也要與時俱進,有所新意,有針對性,除了命題報告外,更多是自由發揮的自選題,選擇餘地還是很大的。在2000年,我力推了統計報告,想改變以往就進度分析的“短板”,所以連續寫了《如何看待湖州財政收入佔GDP偏低問題》,《搶占制高點—對湖州高新技術產業發展情況的分析》,《對湖州“兩創一奔”的幾點思考》,《對湖州工業立市、工業強市的若干思考》,《湖州離基本實現現代化還有多遠?》等,打出了品牌,基本是湖州日報全文發表的,所以選題很重要,從統計的角度去解讀一些決策和經濟問題,應該是大家有興趣去關注的。