[資工雜筆] awk 好用用法整理

抓放實驗的空檔,花時間從以下網址整理一些好用的 awk 用法,之後如果需要查的話也方便許多。這篇選出的每一個用法都不會放解釋 (沒時間QQ),解釋請參照 原網址來源 。廢話不多說,開始囉。 首先,如果有一個 file 長這個樣子: Name Domain Deepak Banking Neha Telecom Vijay Finance Guru Migration 只把名字印出來 $ awk '{print $1}' file Name Deepak Neha Vijay Guru 把 header…

Continue Reading [資工雜筆] awk 好用用法整理

[資工雜筆] awk 簡單用法

其實以前有稍微使用過 unix 系統裡的 awk 來處理指令吐出來的結果,但都不是太難的組合,所以其實也不算真正了解,並能活用這個指令。今天剛好遇到一個蠻不錯的機會,可以把這東西完全學會,順便把這個過程記下來。 首先是文本的內容,大致上長這個樣子,亂碼指的是不要的東西 %$#!@%@%^$^%&#%^&#$^%&#^$&#%^&#^% 1th object: person 2th object: sky 3th object: building 4th object: truck ... 97th object: face 98th object: street 99th object: ramp 100th…

Continue Reading [資工雜筆] awk 簡單用法

[資工雜筆] wget 用法

因為要幫實驗室做網站,要把大家的圖片都抓下來,最節省時間的方式就是下一個 wget 全部抓完 以下來自 stack overflow Try this: wget -nd -r -P /save/location -A jpeg,jpg,bmp,gif,png http://www.domain.com More information: -nd prevents the creation of a directory hierarchy (i.e. no directories). -r…

Continue Reading [資工雜筆] wget 用法

[資工雜筆] Bash 指令分割密碼表

雖然用了很久的 Unix-like 的系統,但其實我還不會使用很多的指令。需要用到的時候,才會去查一下,但也花了我不少的時間在 try error。這邊簡單記錄一下我今天做的事。 事情是這樣的,我在網路上找到了一個很好用的 password dictionary。因為 Mac 的容量很小,所以我都是能省則省,可以放到雲端就放到雲端。這種 password dictionary 畢竟也不是很常用,但有時候就是會用到,索性把它上傳到 github ,也可以和別人分享。 但問題來了,github 有限制單一檔案的大小必須小於 100 MB,建議小於 50MB,而這個密碼表有 700 MB,於是我只能把它拆解成不同的檔案上傳。花了一節課的時間 try 了一下,指令如下: 先取得檔案總行數 wc -l 01.txt 再來做檔案分割 for…

Continue Reading [資工雜筆] Bash 指令分割密碼表

[資工雜筆] 線上讀書會–深度學習分享

緣起 上次在鐵人賽時,遇到了線上讀書會的創辦人 Polo ,跟他聊了一下有關線上讀書會狀況,也聊到我最近在做的事。Polo 也順勢邀請我到線上讀書會,分享我最近在做的事。 聽他說有很多人想聽這個主題,於是我在1個月前,就開始慢慢準備。考慮到很多人可能不太能馬上掌握深度學習的數學,加上又是讀書會第一次有人分享這個主題,所以我就用一個比較overview 的方式呈現這個 talk。 PPT + 程式碼 https://github.com/noootown/Forex-DQN 影片 影片的部分有兩段,因為講到一半不知道為什麼 zoom 斷線了XD。 https://www.youtube.com/watch?v=gdrnJ_e2PaM https://www.youtube.com/watch?v=qjCS6Iaygmw

Continue Reading [資工雜筆] 線上讀書會–深度學習分享

[程設雜筆] callback, promise, fetch, yield, async/await 發展簡易介紹

好久沒有寫技術文章了XD。快利用時間記錄一下一些心得。 這篇久違的文章,想要探討的是javascript最有魅力的一個部分,非同步 (asynchronous)。 為什麼會說它是javascript最有魅力的一個部分呢?那是因為javascript本身應用的環境就充滿了各種非同步。打個比方好了,如果前端要和後端抓個資料,總不能送出request後,就block住吧,那如果資料沒回傳回來,不就GG了?其它事情都不用做了。所以,最正確的解,一定是送完request後,就繼續去做其它事,等待回來的結果,再根據結果做事。 我想如果有耳聞promise, ES6 yield, ES7 async/await 的朋友,應該不會錯過網路上有關於它們的文章和比較。不過說實話,有認真把它們都抓起來做一個完整比較和推演的文章,其實沒有很多,希望今天這一篇可以給想要了解這部分的人一個很完整的啟發,了解關於非同步這一塊,js是怎麼演進的。 Callback 首先,我們要先講一下,到底什麼是callback。callback 是 javascript 很常用到的一種寫法,要熟悉js的話,就絕對不能不理解 callback 是什麼。 簡單來說,callback就是把A function傳進另一個 B function,當B function做完事後,就 call A function,做它該做的事。通常的用法是在讀資料庫的時候,或者call api的時候會使用到。因為這些動作都是非同步的,當做完事後,就要使用一個callback,來接這個資料,做該做的事。 要想像一下的話,大概就是今天你媽要炒菜,發現沒有醬油。剛好覺得在旁邊看電視的你太廢了,就叫你出去買罐醬油。你出去買的同時,媽媽還是在炒菜,只是沒有加醬油,沒辦法上菜罷了。於是為了省時,她就先切盤水果。 function 媽媽叫(跑腿完工作= 醬油買回來){…

Continue Reading [程設雜筆] callback, promise, fetch, yield, async/await 發展簡易介紹

[點點滴滴] CTJS slide 整理

以下是這次去 CTJS,所選出來,一些我較有興趣的slide。   Redux 設計概念與實戰  DMoon: http://goo.gl/K2y8ck Node.js 與 Bot  Simon: http://slides.com/simonsun2001/bots/embed React Native intro chentsulin: https://chentsulin.github.io/react-native-intro 十分鐘寫一個前端測試  alin: CTJS 投影片 https://github.com/alincode/ctjs-webdriverio-sandbox 快快樂樂5分鐘學react zet: http://goo.gl/Cmfkmk

Continue Reading [點點滴滴] CTJS slide 整理

[前端連載] html巢狀結構基礎——div 和 span

簡介 上次介紹了基本的html tag,這次來講一下,html中很重要的巢狀結構。如果有仔細看的話,應該會發現html是一層一層包住的,最外層是html tag,再來有body tag,還有我們寫的tag,包括h1 ~ h6之類的。 這次,我們要介紹兩個很重要的東西,分別是 div 和 span tag。這兩個 tag 在 html 之中很常出現,並清楚的標示我們的html結構。要學好網頁前端,一定要搞清楚他們的功能和差異性。 開始囉! 尿布和啤酒,是否該放一起賣? 談到很紅的big data,就不得不介紹一個經典的例子——尿布和啤酒。美國的零售業者沃爾瑪,裡頭的資料科學家在分析購買數據時,發現了一個很重要的事實。每到星期五晚上,尿布和啤酒的銷售量有正向關,而且同時提升。 蛤?尿布和啤酒?這個組合也太奇怪了吧。 你沒聽錯,就是尿布和啤酒。 該不會是星期五會定期舉行什麼奇怪的尿布啤酒party吧。 Nice Guess! 不過有其它原因,我們繼續聽下去。 這實在是不太尋常。經過調查之後,才知道,原來星期五晚上,爸爸們會到超市們幫baby買尿布,然後順便買些啤酒,回家看球賽。於是,沃爾瑪調整銷售策略,把啤酒和尿布放在同一區,果不其然,尿布和啤酒的銷量都大大的提升。 所以,這和我們的網頁架構有什麼關係? 當然我們這篇不是要講大數據多麼威猛。只是你是否在寫網頁時,發現常常會有某些東西,像是啤酒和尿布一樣,該被放在一起的?譬如一篇文章,便含有標題、副標題,文章預覽、日期……。若是如此,那我們就用個div把他給包起來,他們就算是一個區塊。請看下圖,每一個紅色包起來的範圍,都算是一個區塊。再仔細看一下左邊的文章,還可以發現大區塊裡有很多小區塊,分別包含標題、副標題,文章預覽、日期,這也是div包起來的喔。 把它包成區塊有什麼好處呢?好處一,設定css方便。如果我們要為這個區塊設定樣式,那我們只要在這個div區塊加上css即可,其它的地方就不會被動到。如果我們一次要給很多類似的區塊設定個樣式,設個…

Continue Reading [前端連載] html巢狀結構基礎——div 和 span

[資料科學] data tidying 的重要性

關於 data tyding,其實就是讓資料便得比較好讀,以下這邊整理兩個我覺得不錯的解釋。 data tyding 到底是什麼? http://garrettgman.github.io/tidying/ dplyr tidyr cheat sheet: https://www.rstudio.com/wp-content/uploads/2015/02/data-wrangling-cheatsheet.pdf  

Continue Reading [資料科學] data tidying 的重要性

[資料科學] R語言初學雜筆

最近開始學起了R語言。R語言和一般的程式語言有很大的不一樣,學起來跟當初剛學JS一樣,挺費力的。於是做這篇筆記,把最近兩個禮拜R語言的體會記錄下來。

(more…)

關於我:

我是沒一村,專長和興趣是程式、主動投資、科技商業模式。可以參考我的書單和比較熱門的文章:

Continue Reading [資料科學] R語言初學雜筆