2010年9月24日

XML 的第一堂課

概述:

可延伸標示語言eXtensible Markup Language,簡稱XML),又稱可延伸標記語言,指利用電腦所能理解的資訊符號,透過此種標記,電腦之間可以處理包含各種資訊的文章等。如何定義這些標記,既可以選擇國際通用的標記語言,比如HTML,也可以使用像XML這樣由相關人士自由決定的標記語言,這就是語言的可延伸性。XML是從標準通用置標語言(SGML)中簡化修改出來的。 HTML的使用目的是排版資料,修改資料的顯示,XML 並不是用來編排內容,而是用來描述資料,因此,它並沒有如同 HTML一般的預設標籤,使用者需要自行定義描述資料所需的各種標籤。

發展歷史:

XML是從1995年開始有其雛形,並向W3C(全球資訊網聯盟)提案,而在1998二月發佈為W3C的標準(XML1.0)。XML的前身是SGMLThe Standard Generalized Markup Language)。

1978年,ANSI將GML加以整理規範,發佈成為SGML,1986年起為ISO所採用(ISO 8879),並且被廣泛地運用在各種大型的檔案計劃中,但是SGML是一種非常嚴謹的檔案描述法,導致過於龐大複雜(標準手冊就有500多頁),難以理解和學習,進而影響其推廣與應用。

同時W3C也發現到HTML的問題:

  • 不能解決所有解釋資料的問題 - 像是影音檔或化學公式、音樂符號等其他形態的內容。
  • 效能問題 - 需要下載整份檔案,才能開始對檔案做搜尋。
  • 擴充性、彈性、易讀性均不佳。

為了解決以上問題,專家們使用SGML精簡製作,並依照HTML的發展經驗,產生出一套使用上規則嚴謹,但是簡單的描述資料語言:XML。 XML是在一個這樣的背景下誕生的——為了有一個更中立的方式,讓消費端自行決定要如何消化、呈現從服務端所提供的資訊。

XML與HTML

舉例來說,下面這段HTML碼,將成績結果以table的方式呈現:
       

       

姓 名國 文數 學
小 明9076
小 華8581
此時若是利用XML,則可以將此成績結果以下列的方式呈現:

由上面的例子我們可以很清楚的看到,XML並未如HTML包含了顯示的標記,無法讓瀏覽器依照其格式來顯示。但是它以巢狀結面清楚的標示了各元素之間的關係,但電腦可以很容易的判別各個元素。

2010年2月28日

使用案例圖

使用案例(use case)

使用案例(use case)可以展示系統功能或系統行為。使用案例是描述系統與使用者在特定情境與目標下的一系列互動行為。使用案例描述在不同的情境下,系統針對行為者要 求的回應。行為者對系統提出達成特定目標的需求,系統再根據要求回應行為者。使用案例的名稱可為現在式時態的動詞片語,包含動詞(系統應該做什麼)與動詞 的受詞(系統應該對哪一個對象進行操作)。

使用案例圖(use case diagram)

使用案例圖是UML最常用的三種圖之一,許多專家認為,如果把UML 2 的13款圖簡化一下,大概只會剩下3種圖,使用案例圖就是其中之一,而另外兩款則是類別圖以及循序圖。使用案例通常用來表達系統的功能觀,它的組成元素很 簡單,就是「使用案例」(use case)、行為者(actor)和兩者之間的關係線。簡單來說,使用案例代表系統對外提供的服務或功能,而參與者則是位於系統外部,會直接接觸系統並啟 動使用案例的使用者,或者是支援使用案例的其他連線系統。建構使用案例圖的步驟依序為:找出行為者、找出使用案例、描述使用案例、找出使用案例的關係,最 後繪出使用案例圖。









找出行為者

行為者可以從使用者與企業需求描述中的名詞、代名詞與名詞片語等,找出合乎行為者定義的人、組織或相關系統。

找出使用案例

許多專家建議,由行為者找出使用案例是一個有效的途徑。也就是說,先找出行為者,再逐一檢討行為者以找出其所參與的每一個使用案例,之後會有相關事 件的回應,直到完成使用系統的目的為止,將這一系列事件有組織的集合起來便成為一個使用案例,但這些事件間必須符合內聚力的原則。

描述使用個案

一個完整的使用個案內容應包括行為者、使用個案目標、使用個案發生之前提與結束狀態、一系統事件描述等。使用個案描述是從使用者的觀點,描述使用者 欲達成某項目標或功能的作業行為,此時應著重企業的作業處理或功能描述,而不應涉及電腦化的程式邏輯;一系列事件的描述除了正常程序外,最好也能包括例外 狀況的描述。

找出使用案例間的關係

使用案例間的關係主要可以分為三種:Include、Extend和Generalixation。Include可視為某一使用案例「A」會用到 另一個使用案例「B」,關係的箭頭符號應由A指向B。Extend的關係可視為是某個使用案例(例如 A )在某情況時會被插入至另一個使用案例的定義中(例如 B ),而形成一新的組合使用案例,則關係箭頭符號應由A指向B。Generalization的關係意味著使用案例間的繼承關係,例如子使用案例會繼承父使 用案例的行為與意義,且子使用案例可擁有其個別的行為與意義。

繪製使用案例圖

完成上述工作後,最後是繪製使用案例圖。繪製步驟為先繪出所有行為者與使用案例,將行為者與使用案例間有互動者以互動符號連結,接著再確定使用案例間的關係,並以適當的關係符號連結。

2010年2月23日

PHP與MySQL

實際的開發案中,PHP程式總是配合資料庫進行Web開發和應用,才能發揮出程式最大的效能,在這些資料庫之中,MySQL資料庫是PHP最強大的合作夥伴,絕大多數的PHP網站都是採用MySQL作為網站的資料庫,MySQL最著名的資料庫管理工具就是用PHP編寫的phpMyAdmin。

MySQL資料庫簡介
SQL是結構化查詢語言(Structured Query Language)的簡寫,SQL語言結構簡潔,功能強大,簡單易學,所以自從IBM公司1981年推出以來,SQL語言得到了廣泛的應用。如今像是Oracle、Sybase、Informix、SQL SERVER這些大型的資料庫系統,都支援SQL作為查詢語言。MySQL是基於SQL的目前世界上開源(Open Source)資料庫中最受歡迎的產品之一。由於它是免費的,而且在性能和穩定度上絲毫不遜於其他的商業資料庫,因此得到了廣泛的應用。同樣作為開源免費軟體的Apache、PHP和MySQL三者結合被認為是Web應用的最佳組合,分別用做Web伺服器、伺服器端程式解譯器和資料庫,這個組合被眾多使用者親切地稱為APM。

至於MySQL的資料管理、語法以及各項的操作都和SQL SERVER沒有太大的差異,圖資系有上過資料庫的同學應該很熟悉,這邊就不特別介紹。

PHP操作MySQL資料庫
PHP5內置了MySQL資料庫的用戶端,提供了大量的MySQL資料庫專用的函式來與其互動。在所有的互動指令之前,我們需要使用 mysql_connect()函式建立PHP和MySQL資料庫的連結。
與資料庫建立連結之後,我們就可以進行各種查詢操作,接下來,需要用 my_select_db() 函式來選擇使用的資料庫。
每次的PHP、MySQL程式設計,都是要以類似下面的語法來開始
在建立MySQL連結、選擇要使用的資料庫之後,就可以開始執行各種SQL查詢了。PHP查詢MySQL資料庫功能的函式是mysql_qurey()。他的語法是 mysql_query("$query"),其中$query是各種SQL語法。例如: mysql_query("SELECT id, name From tbl_name" )。
我們現在已經可以透過PHP來操作MySQL資料庫了,但要想在PHP中使用透過SELECT語法從資料庫查詢傳回的資料集,還需要使用 mysql_fetch_array() 函式。 mysql_fetch_array() 函式可以從 mysql_query() 函式執行 SELECT 語法查詢傳回的資源識別字的資料集中取得一筆資料作為陣列回傳,PHP程式就可以獲知MySQL資料庫的資料了。

2010年2月22日

循序圖 & 合作圖

物件導向系統的資料結構塑模主要以類別圖與物件圖表達物件間的靜態資料結構;而物件互動行為則主要以互動圖來表達物件間動態的互動行為。互動圖包含循序圖與合作圖,一個互動圖描述一個使用個案內物件間的互動行為。其中,循序圖著重以時間發生的先後順序來表達物件間的訊息傳遞與與處理之程序;而合作圖則著重表達物件間的連結結構,並能同時展現物件間的訊息傳遞與處理之程序。

循序圖(Sequence Diagram)
循序圖主要用於描述許多物件在單一使用個案中的互動行為,但不太適合用於對這些行為的精準定義(較精準的定義用狀態圖或活動圖來描述為佳)。循序圖強調以時間發生的先後順序表達物件間的訊息傳遞與處理程序,其重要元件包括類別的物件、訊息、操作與操作描述要生命線與控制焦點等。


物件
如果尚未建構類別圖,而先建構循序圖,循序圖上物件之確認準則與類別圖相同;如果先完成類別圖,再建構循序圖,則循序圖的物件可以直接用類別圖上類別之物件,其表達方式是在類別的名稱下劃一底線。原則上,循序圖的物件是放置在循序圖的上方。

訊息
循序圖的訊息(Message)或刺激(Stimuli)是由某一物件送至另一物件以啟動操作。一般來說,訊息常需與操作相結合。在循序圖中,訊息是以水平的箭頭表示,而且箭頭起始於傳送訊息的區域(也就是控制焦點),終止於接受訊息的區域。大部份的循序圖都由一個來自於系統外部的訊息所啟動。

操作與操作描述
循序圖的操作(Operation)在於描述循序圖中,某一物件接到另一物件送達的訊息,接收端的物件為了執行發送端物件送來的要求,所提供因應處理該訊息的方法。操作描述是操作的細部詳細說明,主要是從系統行為的觀點,描述系統的動作與邏輯順序所需的輸入與輸出。操作描述是往後程式設計的重要依據,程式編輯完成後,這些操作描述可作為程式的註解。

生命線
循序圖的生命線(Lifeline)是劃在物件底下與物件重直的虛線,用來表達物件在某時段的存在。

控制焦點
循序圖的控制焦點(Focus of Control)表達物件執行某動作的時段,包括由其執行或透過其附屬程式。控制焦點用長條圖表示,且與該物件的生命線重疊。

合作圖(Collaboration Diagram)
合作圖主要用來描述許多物件在單一使用個案中的互動行為,和循序圖一樣,不太適合用於描述這些行為的精準定義。但合作圖強調以物件的結構化組織表達物件間的訊息傳送/接收與處理程序。合作圖的重要元件包括類別的物件、連結、訊息與操作等。


物件
合作圖的物件與循序圖的物件相同,都是來自於類別圖上類別的物件,或直接由使用個案圖描述找出,其表達方式是在類別的名稱下劃一底線。

連結
合作圖的連結(Link)是用於表示一個物件如何與另一個物件連接,以直線來表示。合作圖上的連結也就是物件間的路徑(Path)。

訊息
合作圖的訊息(Message)包含兩物件間的訊息傳送/接收內容與操作,並且將這些訊息伴隨著一個箭頭來表示。訊息的發生順序可在訊息前面加一個序號來表示,在合作圖中這些序號都是唯一的。序號以自然數(1, 2, 3 ...)表示其發生順序;也可以用杜威數( Dewey Decimal Numbering, 1.1, 1.2, 1.3, ... )表示巢狀的發生順序。

2010年2月21日

PHP的會話管理--Cookie

Cookie的概念
Cookie是一種在客戶瀏覽器端儲存資料並以此來跟蹤和識別用戶的機制,與Session類似,Cookie變數的作用範圍同樣可以整站跨頁面有效,所不同的是,Cookie變數儲存於用戶端的瀏覽器,並可以指定有效時間,而Session變數則在結束網站連結時即告失效。
一般用Cookie來代表由網站伺服器發送出來儲存在用戶端瀏覽器上的小量資訊,從而使得訪客下次又連接該網站時,可從瀏覽器讀回這些資訊。這種機制是很有用的,可以讓瀏覽器訪住訪客的特定資訊,如上次連結的位置、花費的時間或使用者首選項。Cookie就是在瀏覽器目錄中儲存這些資訊的文件檔。

Cookie的傳遞流程是這樣的:
當在瀏覽器位址欄中輸入了一個Web網站的URL位址時,瀏覽器就會向該Web網站發送一個讀取網頁的請求,並將結果在顯示器上顯示。這時該網頁在你的電腦上尋找這個網站設置的Cookie文件,如果找到,瀏覽器會把Cookie文件中的資料連同前面輸入的URL一同發送到網站伺服器。伺服器收到 Cookie資料,就會在它的資料庫中檢索我們的ID、購物記錄、個人喜好等資訊,並記錄下新的內容,增加到資料庫和Cookie文件中。如果沒有檢索到 Cookie或你的Cookie資訊與資料庫中的資訊不符合,則說明我們是第一次瀏覽該網站,伺服器的CGI程式將為我們創建新的ID資訊,並保存到資料庫中。

Cookie是利用了網頁中的HTTP表頭資訊進行傳遞,瀏覽器的每一次網頁請求,都可以伴隨Cookie傳遞。Cookie在電腦上保存的時間是不一樣的,這些都是由伺服器的設置不同決定。Cookie有一個Expires(有效期)屬性,這個屬性決定了Cookie的保存時間,伺服器可以透過設定Expires欄位的數值,來改變Cookie的保存時間,如果不設置該屬性,那麼Cookie只在瀏覽網頁期間有效,關閉瀏覽器,這些Cookie自動消失,絕大多數網站屬於這種情況。

伺服器可以利用Cookie包含資訊的任意性來篩選並經常性維護所記錄的這些資訊,以判斷在HTTP傳輸中的狀態。Cookie最典型的應用是判定註冊用戶是否已經登錄網站,尤其是各大論壇登錄時都有有效時間的選項,使用者可能會得到提示,是否在下一次進入此網站時保留使用者資訊以便簡化登錄手續,這些都是Cookie的功用。另一個重要的應用場合是「購物車」之類處理,用戶可能會在一段時間內在同一家網站的不同頁面中選擇不同的商品,這些資訊都會寫入Cookie,以便在最後付款時提取資訊。

Cookie雖然方便使用,但是在某種程度上已經嚴重危及用戶的隱私和安全。其中的一種方法是:當我們為了市場調查、商品搜索等目的透過搜尋引擎搜到一些陌生網站並連接時,這些網站包含了一種叫做網頁臭蟲的圖片,該圖片透明且只有一個像素大小以便隱藏,它們的作用是向所有連接過此頁面的電腦寫入 Cookie。而後,一些其他網站將讀取這些Cookie資訊,並尋找寫入這些Cookie的網站,就可能發送包含了針對這個網站相關產品廣告的垃圾郵件給我們,給我們的工作和生活帶來騷擾。

另外使用Cookie還會有Cookie欺騙的風險,儘管Cookie沒有病毒那麼危險,但它仍包含了一些敏感資訊:用戶名、電腦名、使用的瀏覽器和曾經連接的網站等,而使用者是不希望這些內容洩漏出去,尤其是當其中還包含有私人資訊的時候。Cookie所記錄的這些資訊,如果在網上傳遞,通常使用的是MD5方法加密以防被他人輕易讀取,雖然這些加密後的資訊在我們看來只是一些毫無意義的字母數字組合,只有伺服器的CGI處理常式才知道它們真正的含義,這些經過加密處理後的資訊,即使被網路上一些別有用心的人截獲,也看不懂,因為他看到的只是一些無意義的字母和數字,然而,問題是,截獲Cookie 的人不需要知道這些字串的含義,他們只要把別人的Cookie向伺服器提交,並且能夠通過驗證,他們就可以冒充受害人的身份,登錄網站。這種方法叫做 Cookie欺騙,Cookie欺騙實現有前提條件是伺服器的驗證程式存在漏洞,並且冒充者要獲得冒充的人Cookie資訊。目前網站的驗證程式要排除所有非法登錄是非常困難的,而且要獲得別人Cookie是很容易的,用支援Cookie的語言編寫一小段代碼就可以實現,只要把這段代碼放到網路裡,那麼所有人的Cookie都能夠被收集。目前還沒有特別的防範方法,我們也只能使用通當的防護方法,不要在論壇裡使用重要的密碼,也不要使用IE自動保存密碼的功能,以及儘量不登錄不瞭解底細的網站。

設置Cookie
PHP在HTTP協定的表頭資訊裡發送Cookie,必須在其他資訊被輸出到瀏覽器前設置Cookie,這和要header()、Session的初始化限制類似。設置Cookie的函式是setcookie()或setrawcookie(),還可以透過向用戶端直接發送HTTP表頭來設置。

接收和處理Cookie
PHP對Cookie的接收和處理的支援非常的好,是完全自動的。我們可以直接用PHP內建超級全域變數$_COOKIE來讀取瀏覽器端的Cookie。

刪除Cookie
可以呼叫只帶有name參數的setcookie()或者把有效時間設為小於當前時間和把值設置為空就可以刪除某個Cookie的值,這個Cookie在這個頁面瀏覽完之後就會被刪除了(其實是失效了)。

2010年2月12日

PHP的會話管理--session

PHP的變數作用範圍是侷限在同一個PHP文件中的,在函式主體中的變數作用範圍更是被侷限在函式主體{}中;form可以讓我們在兩個頁面中傳遞資訊,當我們需要在所有的頁面中都存在的資訊,則可以通過儲存於伺服器端和瀏覽器用戶端的Session和Cookie兩種變數,來實現全站有效的作用範圍。

Session的概念
使用者訪問一個網站時往往需要瀏覽許多網頁,對於一個PHP程式設計的網站來說,用戶在連結的過程中需要執行許多的PHP指令檔,然而由於HTTP協議本身的特點,使用者每執行一個PHP程式都需要和Web伺服器重新建立連結;又由於無狀態記憶的特點,此次連結無法得到上次連結的狀態,這樣,使用者在一個PHP程式中對一個變數進行了指派操作,而在另一個PHP程式中是無法得到這個變數的值的。
由於這兩個特點,我們無法得知使用者的瀏覽狀態,此時就需要透過Session 這樣的機制來記錄使用者的有關資訊,以供使用者再次以此身份對Web伺服器提出請求時做確認。Session解決方案,就是要提供在PHP程式中定義跨網頁全域變數的方法,使得這個全域變數在同一個Session中對所有的PHP程式都有效。
Session通常是和Cookie聯合工作的,首先在伺服器端PHP為建立Session的使用者產生一個獨一無二的字串,用來標識這個使用者的Session,一般將這個字串稱作Session ID,然後以”sess”+Session ID 為檔案名在伺服器的檔案系統中建立一個文件,在文件中保存用戶在Session 所定義的全域變數的變數名和值,最後再將Session ID作為一個名為PHPSession的Cookie保存在用戶端的檔案系統中。然後,當用戶再次連接伺服器訪問一個PHP程式時,PHP從用戶發來的PHPSession這個Cookie中得到用戶所有Session的Session ID,並根據Session ID從伺服器的檔案系統中找到保存Session資訊的文件,從這個文件中讀出用戶在上次連接時所設置的全域變數值。

使用Session
在PHP中,Session的變數是用文件的形式來儲存的,要想使用Session,需要先在php.ini中設置Session文件的位置,將其替換成我們自己設定的Session目錄。PHP程式中的Session變數不是直接就可以使用的,需要在程式碼中先通過session_start()函式來初始化Session。

設置Session生命週期
一般來說,瀏覽器結束訪問離開網站時其生命週期也同時結束,但是儲存Session資訊的文件仍然存在於Session儲存資料夾中,下次再重新打開瀏覽器連接該網站會重新分配Session ID,如果我們使用session_id()把以前的ID帶回來,則會去讀取殘存在Session儲存資料夾中的相應文件,取回先前所有已經設定的Session變數。

註冊Session
透過session_start()初始化Session後,我們就可以使用session_register()函式來註冊一個新的Session變數使用。
函式語法:boolean session_register(string name)
本函式增加一個新的變數到目前的Session之中,參數name就是新的Session變數名。成功註冊後則傳回true值。Session變數註冊成功後,即可通過$_SESSION[name]的方式呼叫此變數來使用。如果想確認某個名稱的Session變數是否已經被註冊,可以使用session_is_registered()函式來判斷。

刪除Session
與session_register()函式對應,session_unregister()函式可以刪除一個已註冊Session變數。
函式語法:boolean session_unregister(string name)
本函式在當前的Session中刪除參數name指定的Session變數。刪除成功則傳回true值。如果客戶要結束一個網站的連結,我們需要在伺服器中結束此用戶的Session,使用session_destroy()函式來關閉Session環境。

2010年2月11日

大家一起來打造年度計劃書

雖然已經是二月中,轉眼就到農曆新年,不過還沒好好規劃今年度計劃的大家,一起來打造自己的年度計劃書吧!

二次大戰期間艾森豪帶領同盟國聯運,跨越英倫海峽反敗為勝,靠的就是縝密的情報蒐和靈活應變。艾森豪的名言:「Planning is everything. Plans are nothing! 」可以理解為:必須隨時把「計劃」當作動詞,只是「計劃」當成名詞,是完全沒用的。若你只是抱著交差心情完成名詞的計劃書,那麼只是在浪費自己的時間。但是,若能夠藉著撰寫過程,培養計劃和企劃能力,把計劃當做動詞,將可反守為攻。

年度計劃書三大功能:
雖然大部份的同學都還不是上班族,但是在未來的不久,都會成為上班族。因此,我們可以試著以職場的方式來擬定年度計劃書,在職場每一個領域的每個人都需要計劃,上班族憑好的企劃力就可以翻身和加薪,所以,大家可以趁這個時候開始練習。好的年度計劃書,至少具備以下三大功能:
功能一:管理你的優先順序
當你的策略聚焦,資源分配也會更為精準、有效率。譬如你的時間和短期工作計劃,會投入到有助於達成長期目標相關的準備。其他和達成長期目標無關,甚至可能偏離長期目標的事,則可以暫時被擱置。
功能二:形成責任感
目標已經白紙黑字寫下,年度目標成為自我管理最好的工具,挑戰訂下的目標,也成為超越自己的成就感。
功能三:追蹤表現的指標
每一個星期、每一個月、每一季,都可以針對年度計劃書檢討達成進度。就外在變化,檢查目標達成的進度,隨時修正,才不至於偏離長期目標。

完全撰寫的三大祕訣
打破交差的心態,寫出一份充滿行動力的出色年度計劃,可以參考圖書館管理課程時,老師所提到的幾點訣竅,應該掌握以下三大訣竅:
訣竅一:目標導向
找到目標,也就是願景和使命,然後把目標具體化,目標就是年度計劃的主題,因此找到目標是第一件要務。
訣竅二:從結構入手
擬定年度計劃書,就是預先系統化的整理資訊,想要提出好的企劃書,應該嘗試把各式各樣的訊息系統化,將市場、顧客、商品、公司等各種關聯加以說明,再把架構清楚條列出來。最後,還要釐清自己在這個架構中的定位,也就是說,隨時都應該要學會掌握組織,並且看清楚從何處切入和施力可以有進展。
訣竅三:和人生計劃書契合
大多數人都認為在事業上隨時靜下心來撰寫計劃書是理所當然的事。但是讓自己的人生目標明確化,和在公事上把目標推動方式具體寫下是一樣的。你工作上的年度計劃書,應該和你長期的人生計劃書一致。如此,工作就不是責任,而是人生理想的一部份,工作起來一定會非常有勁。

大部份的同學在今年將面臨大學畢業的挑戰,不論是繼續升學或者是投入就業市場,一份好的計劃書將會有你的人生有相當大的助益。如果還沒擬定計劃書的同學,利用農曆年假期的這幾天,開始擬定自己的年度計劃書吧!!

2010年2月9日

資訊系統分析與設計

系統分析師(System Analyst)
資訊系統(Information System, IS)可以蒐集、處理、儲存及散佈資訊,協助管理者進行經營決策、問題分析、重塑工作流程、控制作業、創新產品與服務。系統分析與設計(System Analysis And Design)是一門關於開發資訊系統的學問,其中系統分析牽涉到研究現在的系統,瞭解其運作模式及如何滿足使用者的需求,而系統設計是以系統分析的結果為基礎,改善現有的系統或開發新的系統。系統分析師的工作包括系統分析與系統設計兩個部份,他們會訪談不同的使用者和管理者,瞭解企業的運作模式及需求,然後提出並評估各種解決方案,供管理者選擇。

系統開發生命週期(System Development Life Cycle, SDLC)
系統開發生命週期雖然是相當古老的資訊系統建置方式,但目前仍常應用於中、大型系統,例如交易處理系統(TPS)、管理資訊系統(MIS)、這些系統的特點在於需求結構化,而且能夠事先定義規格。SDLC將系統建置過程分成下列五個階段:
一、系統調查(System Survey):定義問題(本質、範圍與目標)、發掘機會、進行規劃及評估可行性,然後撰久專案企劃書。
二、系統分析(System Analysis):蒐集與分析現有的系統,然後訂定新系統的需求。
三、系統設計(System Design):完成新系統的邏輯設計,包括規格及運作模式,但不涉及程式設計。
四、系統開發(System Development):完成新系統的程式設計,包括專案排程、撰寫程式及測試。
五、系統上線(System Implementation):將現有的系統轉換成新的系統,包括系統轉換、檔案與資料庫轉換、設備轉換、教育訓練、安全稽核、系統評估、系統維護。
由於SDLC有固定的架構,而且在時程的安排上受到嚴格的限制,一定要一個階段接著一個階段的完成系統分析與設計的工作。因此,為了改善系統分析與設計的流程,有一些不同的方法被發展出來,其中最具代表性的包含雛型法、協合應用系統設計、CASE工具及快速應用系統開發。

雛型法(Prototyping)
雛型法乃是指分析師先與使用者溝通並決定系統所需最原始或最基本的需求,然後使用各種開發工具設計並建置一個較小規模但是可以操作的版本。當雛型建立完成後,使用者回報分析師滿意及不滿意的功能,分析師根據這些意見修正原先之雛型,然後再將較新的版本交給使用者使用。這樣的過程不斷的重複,直到使用者對所用系統滿意。

CASE(Computer-Aided Software engineering, 電腦輔助軟體工程)工具
CASE工具是一套以電腦為基礎的產品,針對軟體發展過程中的一個或多個活動來做必要的支援。CASE工具可以支援SDLC各階段的活動,也可以幫觔專案的辨識與選擇、專案的初始與規劃、分析與設計,也可用以幫助實作及維護。

協合應用系統設計(Joint Application Design, JAD)
JAD最基本的概念是將分析階的需求決定過程以及設計階段中的檢核過程加以結構化,使用者、管理人員及系統開發人員聚集在由JAD領導者所主持的密集性、結構化會議。JAD領導者任務在於確保會議過程的結構並掌握會議的議程,將有關資訊系統的人員聚集討論並確認系統需求及設計細節、時程與企業資源的應用,同時也讓所有參與人員能更快速了解系統的運作目標。

快速應用程式開發(Rapid Application Development, RAD)
RAD漸漸成為廣為接受的方法論是因為以網頁為基礎的系統(Web-based System)的快速開發。因此,結合雛型法、CASE工具以及JAD…等方法而成的RAD,可以大幅降低系統設計與實作時間。一般來說,RAD的過程與傳統的SDLC類似,但縮短或合併部分階段,並且運用各種工具,以產生更為精簡的開發技術。

2010年2月6日

物件導向技術的系統分析與設計

物件導向技術(Object-Oriented Technique)是繼結構化技術之後,系統開發上另一受到高度重視的新思維,已經成為軟體工程領域的熱門議題。物件導向的基本概念包括物件、類別、封裝、繼承、同名異式與超荷等,其中的物件、類別、繼承已經在之前的PHP程式設計概念中提到,本篇將針對封裝、同名異式與超荷做簡單的說明。另外,系統開發的相關工作,統一塑模語言,包括使用個案圖、類別圖、循序圖等九種。

封裝(Encapsulation)
物件導向技術將資料及操作此資料的方法包裝成一個物件,稱之為「封裝」。封裝所形成的物件,其結構可分為兩部分:一是定義物件外觀行為的介面(Interface)部份;另一則是存放抽象化的結果及如何達成外觀行為的實作(Implementation)部份。封裝將物件的實作細節隱藏,使其與外界環境隔離,而只允許該物件所包含之操作修改其資訊,稱為資訊隱藏(Information Hiding)。封裝使物件更具獨立性,如果物件內部的資料結構有變動時,只要其外部的操作介面沒有修改,使用這些物件的應用程式就可以不必修改,這樣的特性使得物件導向的系統較容易維護。

同名異式(Polymorphism)
Polymorphism意指「多種型式」,簡稱「多型」,即在不同的物件(或類別)中,利用相同名稱的操作,以不同的方式處理資料,傳送訊息的物件不需要知道接受訊息所屬的類別,接受訊息的物件可以屬於任一類別。例如:某公司計算員工薪水,員工可分為正式員工及臨時員工,而臨時員工又可分為按件計酬與按時計酬,這三種員工都有薪資計算,但是薪資計算的操作又有不同計算方式。

超荷(Overload)
超荷就是在同一個類別中,使用相同名稱的操作,然而每個操作的參數個數、參數資料類型不可完全相同。當使用到此操作時,可以參數個數及參數資料型態的不同來判斷要使用哪一個操作。超荷有時又稱靜態多型。

統一塑模語言(Unified Modeling Language, UML)
統一塑模語言是Rational公司整合Booch、Rumbaugh與Jacobson三種方法而提出的物件導向塑模工具,是一種視覺化(Visualizing)、文件化(Documenting)及規格化(Specifying)的軟體塑模語言,經過不斷地演變與擴充,於2003年6月正式通過UML 2.0標準。在UML 2.0中規範了十三種模式圖,而其中使用個案圖、類別圖、物件圖、循序圖、合作圖、狀態圖、活動圖、元件圖、部署圖等九種較常用於商用資訊系統之分析與設計上。

使用個案圖(Use Case Diagram)
UML的使用個案圖是引用Jacobson方法中的使用個案模式,從使用者的觀點描述系統的行為者與系統間的互動行為與關係。從內部觀點來看,使用個案可描述系統做什麼(What)。從外部觀點來看,它可描述行為者與系統如何互動(How)。

類別圖(Class Diagram)
UML之類別圖是引用Booch與Rumbaugh方法中的類別圖,主要用以表示系統存在之物件型態(類別)及各物件型態間的靜態資料結構與邏輯關係,也表達類別之屬性、操作與類別間連結之限制等。

物件圖(Object Diagram)
UML的物件圖是用來描述一系統於某一時間的靜態資料結構,該圖由一群相關的物件及其連結所組成。物件圖是系統在某個時間點的一個例子,而非系統的定義,可用來表達一個系統複雜的資料結構,或藉由時間序列的系統影像(Snapshots)來表達系統的行為。

循序圖(Sequence Diagram)
UML的循序圖是結合Booch的互動圖與Rumbaugh的訊息追蹤圖而成,主要用以描述系統運作時物件間的互動行為,著重以時間的先後順序為主軸,以表達物件間的訊息傳遞與處理程序。一個循序圖會有一個與之對應的合作圖,但表達的重點與方式不同。

合作圖(Collaboration Diagram)
UML的合作圖是從Booch的物件互動圖與Rumbaugh的物件導向資料流程圖改進而成,主要用以描述系統運作時物件間的互動行為,該圖著重表達相關物件間的連結結構,並能同時展現物件間的訊息傳遞活動。

狀態圖(State Diagram)
UML的狀態圖是結合Booch的狀態轉移圖與Rumbaugh的動態模式而成,用以表示物件在其生命週期中的狀態變化。狀態圖是以微觀物件為主,細分物件所發生的各項事件,並表達物件生命週期之狀態轉變及活動結果。

活動圖(Activity Diagram)
UML的活動圖可用於表達執行某一作業行為中的活動、轉換與條件等。一個活動圖描述一群循序與同步的活動,一個活動可表示一個工作流程步驟或一個運算的執行動作。

元件圖(Component Diagram)
UML的元件圖起源於Booch的模組圖,用以說明系統設計過程各類別與物件的配置,以及敘述軟體元件間的組織架構和關係。元件是開發和執行過程中實際物件的類別,將可分解的實際基本單位模組化,這些基本單位包括模組(Module),並擁有特性和明確定義的介面。

部署圖(Deployment Diagram)
UML的部署圖起源於Booch的處理圖,用來說明系統各軟、硬體元件的配置、關聯,以及同一處理器內執行處理的時程安排等。

物件導向系統開發過程是一種反覆的程序,主要包括需求分析、系統分析與設計、細部設計、程式編寫、測試與部署等階段。物件導向塑模提供了使用個案觀點、設計觀點、流程觀點、實施觀點與部署觀點等,可供不同參與者,在不同時間,從不同的角度來看系統。由於物件導向技術的引進,提升了程式的重用性與可維護性,使軟體的開發與維護更有效率。

2010年1月29日

PHP的XML文件操作

XML簡介
XML, eXtensible Markup Language(可延伸標記語言),是一種可以創建自訂標記符號(Tags)的標記語言,是用於表示結構化資訊的一種標準文本格式,它由W3C(全球資訊網標準維護組織)創建,用來克服HTML的侷限。和HTML一樣,XML基於標準通用標記語言(Standard Generalized Markup Language, SGML),SGML是一種在Web發明之前就早已存在的用標記來描述檔案資料的通用語言,它十分龐大且難於學習和使用。為了解決SGML過於複雜的特點,提出了HTML語言,在Web領域成為標準語言。但近年來,隨著Web應用的不斷深入,HTML在需求廣泛的應用中顯得捉襟見肘,於是Web標準化組織W3C建議使用一種精簡的SGML版本ーXML。XML檔案只儲存了資料,是很有規律的結構化檔案,所有的資訊按照某種關係排列,不會看起來雜亂無章,層次結構非常明確,但沒有定義如何顯示這些資料,以什麼樣的字體、顏色來顯示。這樣的檔案結構,層次非常清晰,我們可以稱之為「檔案樹」。

XML的特點
XML繼承了SGML的許多特性,首先是可擴展性,這正是XML功能強大的原因,在HTML中有許多固定的標記,我們必須記住然後使用它們,而不能使用HTML規範裡沒有的標記,它是一個定型的標記語言。XML允許使用者創建和使用它們自己的標記而不是HTML的有限詞彙表,這一點至關重要,企業可以用XML為電子商務和供應鏈集成等應用定義自己的標記語言,甚至特定行業一起來定義該領域的特殊標記語言,作為該領域資訊共用與資料交換的基礎。

其次是靈活性。HTML很難進一步發展,就是因為它是格式、超文字和圖形化使用者介面語義的混合,要同時發展這些混合在一起的功能是很困難的。而XML更像是一個小型的資料庫,提供了一種結構化的資料表示方式,使得使用者介面分離於結構化資料。所以,Web用戶所追求的許多先進功能在XML環境下更容易實現。

第三是自我描述性。XML檔案通常包含一個檔案型別宣告,因而XML檔案是自我描述的。不僅人能讀懂XML檔案,電腦也能處理。XML表示資料的方式真正做到了獨立於應用系統,並且資料能夠重用,XML檔案被看作是檔案的資料庫化和資料的檔案化,因此XML成為新一代不同系統中資料傳遞的標準格式。

除了上述特性之外,XML還具有簡明性。它只有SGML約20%的複雜性,但卻具有SGML功能的約80%,XML比完整的SGML簡單得多,易學、易用並且易實現。另外,XML也吸收了多年來在Web上使用HTML的經驗,XML支持世界上幾乎所有的主要語言,並且不同語言的文字可以在同一檔案中混合使用,應用XML的軟體能處理這些語言的任何組合。

簡單的XML操作
在PHP5引入了一種用於讀寫XML的新應用程式設計發展介面(API):SimpleXML。SimpleXML提供了一種簡單、直覺化的方法來處理XML。它只有一個單一類型的類別,3個函數和6個方法。SimpleXMLElement類是這個擴展中所有操作的核心類。可以用new關鍵字直接創件這種類的物件或是使用simplexml_load_file()或simplexml_load_string()函數傳回這種類的物件。

在SimpleXML中,可以直接通過元素的名稱來存取特定的元素。當一個檔案被載入SimpleXML時,檔案被看成是一個SimpleXML物件,檔案中的所有元素都被看成是該物件的屬性。SimpleXMLElement物件的屬性是動態的,因為這些屬性是由物件決定的,而不是由類別本身決定的。

利用SimpleXML修改元素內容非常方便,我們可以改變或移除樹中的某個元素,但是不能直接在樹中添加一個元素。要添加一個元素,需要使用DOMXML擴展模組的互通性。我們利用SimpleXML的屬性指派值方法來直接編輯一個元素的內容,要注意的是如果檔案中有多個元素名一樣的元素,如果沒有使用索引來指定要編輯哪個元素時,PHP將發出個警告。強烈建議使用索引來編輯元素,除非你對檔案的結果非常確定。另外,可以用PHP內建函數unset()來將一個元素行樹中移除。unset()的參數必須是一個SimpleXMLElement,用屬性方法來存取要移除的元素。

DOMXML擴展模組有save()方法,可以將XML資料儲存成為文件,我們可以將SimpleXML物件導入DOMXML物件中,然後使用save()儲存。

XML是用來存放資料的,它不是HTML的替代品。XML和HTML是兩種不同用途的語言。HTML是與顯示資訊相關的,XML則是與描述資訊相關的。

2010年1月27日

OSI參考模型、TCP/IP參考模型

OSI參考模型
在過去的電腦網路上,由於資料通訊系統涉及複雜的軟硬體,可是又沒有統一的標準,導致通訊軟體不僅龐大複雜,而且不易測式、修改或分享。為此,ISO(國際標準組織)發展出一套OSI參考模型(Open System Interconnection reference model, 開放系統互連參考模型)。發訊端送出的資料會沿著OSI參考模型的七個層次(layer)一路向下,然後經由資料網路(data network)抵達目的設備,再沿著參考模型的七個層次一路向上抵達收訊端,所謂的發訊端、收訊端可以是電腦、印表機、光碟機、磁碟…等。

OSI參考模型的定義相當寬鬆,它將網路的功能及運作粗略分成下列七個層次,多數的通訊協定都可以放入其中一個層次:

應用層(application layer)
位於OSI參考模型的第七層也是最上層,屬於使用者端應用程式與網路服務之間的介面,負責提供網路服務給應用程式、訊息交換、檔案傳輸、網頁瀏覽…,諸如FTP、DNS、SMTP、Telnet、POP、HTTP等通訊協定均屬於應用層。

表達層(presentation layer)
位於OSI參考模型的第六層,負責內碼轉換、加密/解密、壓縮/解壓縮等工作。

會議層(session layer)
位於OSI參考模型的第五層,負責建立、維護與切斷連線(傳輸模式有單工、半雙工、全雙工等三種)、對話控制、資料交換管理等工作,目的是控制資料收發時機,例如何時傳送資料?何時接收資料?

傳輸層(transport layer)
位於OSI參考模型的第四層,負責區段排序、錯誤控制、流量控制等工作,確保資料安全抵達收訊端的傳輸層,諸如UDP通訊協定與Internet所使用的TCP通訊協定均屬於傳輸層。

網路層(network layer)
位於OSI參考模型的第三層,負責邏輯定址(logical addressing)、路由(routing)等工作,其中邏輯定址是賦予收訊端與發訊端唯一可識別的位址;路由是考慮路徑的實際情況,然後幫封包選擇最佳路徑,如X.25通訊協定、IPX通訊協定與Internet所使用的IP通訊協定均屬於網路層。

資料連結層(data link layer)
位於OSI參考模型的第二層,負責訊框處理、實體定址(physical addressing)、錯誤控制、流量控制、媒介存取控制等工作,其中訊框處理是把從網路層接收的封包(packet)封裝成訊框(frame);實體定址是根據實體位址找出目的設備究竟位於哪個網路的哪部電腦;媒介存取控制則決定了如何避免發生碰撞及如何解決碰撞,常見的方式有CSMA/CD、Control Token…。

實體層(physical layer)
位於OSI參考模型的第一層也是最底層,目的是讓資料透過實體的傳輸媒介傳送,負責定義網路所使用的訊號編碼、基頻傳輸或寬頻傳輸、拓樸、傳輸媒介、傳送速度、傳送距離、接頭、電壓、電流…等規格。

TCP/IP參考模型
Internet採用TCP/IP通訊協定,相較於OSI參考模型將網路的功能分成七個層次,TCP/IP參考模型則是分成下列四個層次,雖然簡化為四個層次,但它並不是去除OSI參考模型的某些層次,而是將功能類似的層次合併,包括將應用層、表達層及會議層合併為應用層,保留傳輸層和網路層,將實體層及資料連結層合併為連結層。

應用層(application layer)
這個層次負責提供網路服務給應用程式,比較知名的通訊協定有FTP(file transfer protocol, 檔案傳輸協定)、SMTP(simple mail transfer protocol, 簡易郵件傳送協定)、POP(Post office protocol, 郵件接收協定)、DNS(domain name system, 網域名稱系統)、Telnet(遠端登入)、SNMP(simple network management protocol, 簡易網路管理協定)、HTTP(hypertext transfer protocol, 超文字傳輸協定)、NNTP(network news transfer protocol)…等。

傳輸層(transport layer)
這個層次又叫做主機對主機層(host-to-host layer),負責區段排序、錯誤控制、流量控制等工作,比較知名的通訊協定有TCP(transmission control protocol)、UDP(user datagram protocol)。

網路層(network layer)
這個層次又叫做網際網路層(Internet layer),負責定址與路由等工作,而且資料是以資料元(datagram)為單位,比較知名的通訊協定有IP(Internet protocol)。

連結層(link layer)
這個層次又叫做網路介面層(network interface layer),負責與硬體溝通,雖然沒有定義任何通訊協定,但基本上,它支援所有標準的通訊協定。

雖然TCP/IP參考模型的定義沒有OSI參考模型嚴謹,但簡化為四個層次卻使得它的處理效率較佳,而且它的結構簡潔易懂,反而比OSI參考模型還受歡迎。

電腦網路--概論

從電腦問世迄今,人們已經習慣使用電腦從事文書處理、資料庫管理、影像繪圖、玩遊戲…等,但隨著資料交換的風氣日盛,電腦網路亦逐漸融入人們的日常生活中。原則上,只要是將超過一部的電腦連接在一起,就能形成網路。我們通常會根據電腦所涵蓋的地理範圍,將網路區分為區域網路、廣域網路、都會網路、網際網路等。

區域網路(LAN, local area network)
當電腦的數目不只一部,而且所在的位置可能是同一棟建築物的不同辦公室、同一個公司或學校的不同建築物,那麼這些電腦連接在一起所形成的網路,就叫做區域網路。常見的區域網路標準有IEEE 802.3 Ethernet(乙太網路)、Fast Ethernet(高速乙太網路)、Gigabit Ethernet(超高速乙太網路)…等。

廣域網路(WAN, wide area network)
當電腦的數目不只一部,而且所在的位置可能在不同城鎮、不同國家甚至不同洲,將這些電腦連接在一起所形成的網路,就叫做廣域網路。常見的廣域網路標準有ISDN(integrated service digital network)、B-ISND(broadband ISDN)、Frame Relay、ATM(asynchronous transfer mode)…等。

都會網路(MAN, metropolitan area network)
涵蓋的範圍介於LAN與WAN之間,使用與LAN類似的技術連接於不同辦公室或城鎮的電腦,它可能是連接數個LAN所形成的較大網路或單一網路。目前由於LAN的傳輸速率與傳輸距離不斷提升,使得MAN與LAN之間的分野日趨模糊。

網際網路(Internet)
是全世界最大的電腦網路,它不是單獨一個網路,而是由成千上萬個大小網路所構成。Internet除了連接數以千萬計的電腦之外,更重要的是它所提供的各項資源,例如全球資訊網(Web)、電子郵件(E-mail)、檔案傳輸(FTP)、電子布告欄(BBS)、部落格(Blog)…等。

網路通常會包含兩部以上的電腦,而電腦之間是如何連接成網路,則有數種方式,我們將這些方式統稱為拓樸(topology),常見的有下列幾種:
匯流排拓樸(bus topology):
所有電腦是連接到同一條網路線,而資料就是在這條網路線上傳送。所有的電腦都會接收網路上的任何資料,然後根據自己的位址擷取要傳送給自己的資料;如果有電腦要傳送資料,必須先判斷是否有其它資料正在網路線上傳送,沒有的話,才能傳送資料。

星狀拓樸(star topology):
所有的電腦是連接到集線器(hub),當電腦要傳送資料時 只要將資料傳送到集線器並指定要傳送給另一部電腦。星狀拓樸的優點是改善了匯流排拓樸的缺點,缺點則是集線器故障會導致網路癱瘓,而且多了集線器的成本。

環狀拓樸(ring topology):
所有的電腦是以環狀方式連接在一起,第一部電腦連接到第二部電腦,第二部電腦連接到第三部電腦,…最後一部電腦再連接到第一部電腦。比起匯流排拓樸和星狀拓樸,環狀拓樸的效能較佳,尤其是在高流量時,因為環狀網路上會一直傳送著一個記號(token),只有取得Token的電腦才能開始傳送資料,待資料傳送完畢並確認目的電腦已經接收到資料後,再釋放記號讓其它電腦使用。

網狀拓樸(mesh):
所有電腦之間互相有網路線連接,不會因為任何一部電腦故障或網路線上任何一段網路故障而導致網路癱瘓,容錯能力為其它網路拓樸之冠。但是架設成本遠比其它網路拓樸高,所以鮮少有網路是真正的網狀拓樸。

2010年1月25日

作業系統--記憶體管理

在現代的電腦系統中,程式與其資料都必須存放在記憶體中,才能直接被CPU所使用,而在多元程式處理系統中,由於記憶體內會同時存放著多份程式與資料,因此作業系統不僅要追蹤並記錄每個程式存放在記憶體內的哪個位址,還要把程式裡面參考到的位址轉換成記憶體的位址。在這邊的解決法方是採用邏輯位址(lobical address)與實體位址(physical address)兩套位址,前者是在程式裡面所指定的相對位置,又稱為「相對位址」(relative address);後者是在記憶體內的實際位置,當程式被載入記憶體時,程式裡面的邏輯位址就會經過位址聯結(address binding)的過程,對應到記憶體內的實體位址。從1960年代以來,多元程式處理技術歷經多次沿革,其主要的記憶體管理方法,包括以下幾項:

分割法(partitioning)
最初的設計是屬於固定分割法(fixed partitioning),其原理是將記憶體劃分成多個大小固定的分割區,雖然各個分割區的大小不一定相同,但在開機後就已經決定,而且作業系統會使用表格記錄分割區的起始位址及長度。一個分割區可以載入一個程式來執行,而CPU就在這些程式之間切換執行。由於分割區的大小固定,而程式的大小卻不一定剛好等於所分配到的分割區,導致可能有剩下一部份空間沒有用到,這個剩下的空間稱為內部碎片(internal fragmentation)。

為了改善內部碎片的問題,於是發展出動態分割法(Dynamic partitoning),其原理是根據程式的大小劃分一塊大小剛好的分割區來存放程式,而且作業系統同樣會使用表格記錄分割區的起始位址及長度。在動態分割法的機制下,可能會發生可用空間的總大小足以容納新程式,但卻因為空間不連續而無法利用的情況,此時這些可用空間稱為外部碎片(external fragmentation)。

分頁法(paging)
由於分割法無法避免碎片的產生,只能透過分割策略改善程度的輕重,為此,發展出另一系列的技術,允許同一個程式載入不連續的記憶體空間,只要可用空間的總大小足以容納該程式即可。分頁法的原理是將記憶體劃分成相同大小的區塊,稱為頁框(frame),然後將程式亦劃分成相同大小的區塊,稱為分頁(page),頁框的大小和分頁的大小通常是一樣的。當程式準備執行時,它的分頁會被載入記憶體的頁框,每個分頁對應一個頁框,但不一定是要連續的頁框,分散或順序顛倒亦無妨。為了記錄程式的每個分頁是載入到記憶體的哪些頁框,所以需要一個分頁表(page table)。

分段法(segmenting)
概念和分頁法類似,只是分割單位不同,分頁法是將程式劃分成大小相同的分頁,分段法是將程式的邏輯記憶體劃分成數個分段(segment),並記錄每個分段的編號及長度,其邏輯位址是表示成<分段編號,位移>格式。同樣的,為了記憶程式的每個分段是載入到記憶體的哪些位址,所以需要一個分段表(segment table)。

虛擬記憶體(virtual memory)
在現代電腦系統中,程式必須整個載入記憶體才能執行,倘若記憶體的可用空間不足,程式就無法執行,此時可以改用虛擬記憶體技術。這項技術的原理是假設有一塊非常大的虛擬記憶體,大小是實體記憶體的數倍,實際上則是規劃一部份的輔助儲存裝置(通常是硬碟)做為虛擬記憶體,當程式準備執行時,即使程式無法整個載入記憶體也沒關系,只要記錄下哪些部份是真的有載入記憶體,其餘的部份還留在規劃成虛擬記憶體的磁碟,然後在程式的執行過程中,若碰到需要執行不在記憶體的部份,再到磁碟讀取,把目前記憶體內比較不會用到的部份挪出到磁碟上,再把要用到的部份換進來,此動作稱為交換(swap),而劃分為虛擬記憶體的磁碟檔案則稱為交換檔(swap file)。

需求分頁法(demand paging)
為了進一步提升記憶體的使用效率,有人結合分頁法和虛擬記憶體技術,發展出需求分頁法,其原理和分頁法類似,也是將記憶體分成多個頁框,將程式劃分成多個分頁,執行時將分頁載入頁框,不同的是程式不必整個載入記憶體就能執行,只要記錄有哪些分頁是真的載入記憶體,而其餘哪些分頁還留在磁碟就可。若程式在執行中,發現所需要的分頁不在記憶體,就必須到磁碟讀取。

需求分段法(demand segmentation)
是結合分段法和虛擬記憶體技術,其原理和需求分頁法類似,也就是程式不必整個載入記憶體就能執行,只要記錄有哪些分段是真的載入記憶體,而其餘哪些分段還留在磁碟即可。若程式在執行中,發現所需要的分段不在記憶體中,則必須到磁碟讀取。

2010年1月24日

作業系統--行程管理

作業系統中需要管理的其中一項重要資源就是CPU時間,現代的作業系統為了提高效率,都會同時執行多個程式,以同時服務更多位使用者,也就必須更精確地控制分配CPU時間給每個程式執行。為了區分程式是否有取得CPU時間,又另外定義了所謂的行程(process),這指的是正在執行中的程式。程式是一組靜態的指令,而行程則是程式在執行時的動態實體。在電腦系統中,每個行程都會歷經從建立、準備好可以執行、正在執行、等待某項資源、直到最後結束之間的幾個狀態,如圖所示。


1.建立(new):行程一開始產生時是處於建立狀態,此時它尚未得到作業系統的允許進入記憶體。
2.就緒(ready):作業系統將行程載入記憶體後,它就進入就緒狀態。在就緒狀態下的行程都是可以立即執行的,只有在等待CPU而已。
3.執行中(running):行程目前正在使用CPU時間執行中,作業系統會決定在就緒狀態下的哪個行程可以下一個使用CPU,等到CPU一被釋放,該行程就可以開始使用CPU。
4.等待中(waiting):行程因為某種原因進入等待中狀態,通常是需要某個除了CPU以外的資源,在取得所需的資源之前,它都無法繼續執行,會一直停留在等待中狀態,直到獲得解決後,再進入就緒狀態,等待下一次使用CPU。
5.結束(terminated):行程已經執行完畢,作業系統也就無須維護其相關資訊。

由於程式的功能日益強大,使用者可能希望在程式執行當中同時進行多個工作,因此許多現代的作業系統會把行程更進一步劃分成多個執行緒(thread),每個執行緒有各自的控制流程,但共同相同的程式碼區塊、資料區塊和作業系統資源。由此發展出一種新的多工方式,稱為多執行緒(multithreading),它允許電腦在單一程式中執行多個工作。為了要使用多執行緒,程式設計人員必須將程式劃分成多個分離的執行緒。

CPU排程演算法(CPU sheduling)的目的是找出下一個可以取得CPU使用權的行程,也就是決定就緒狀態下的哪個行程可以進入執行中狀態,為了解決這個問題所發展出來的CPU排程演算法相當多,常用的有下列幾種:

先來先做(FCFS, First-Come First-Served)
原理是依照行程到達的先後順序來執行,先來的先做,直到做完再輪到下一個,就像排隊買票一樣。FCFS演算法雖然容易實作,但是它忽略了某些重要的因素,導致並不實際。萬一CPU分配給一個需要很長的執行時間的行程,但是它的後面卻排了一堆急著要執行的短行程,結果這些行程都必須等待很長的時間才能輪到。

最短工作先做(SJF, Shortest Job First)
原理是先檢查一遍在就緒狀態下的所有行程,將它們所需的執行時間從小到大排序,然後從時間最短的行程開始執行。一般來說,SJF演算法的平均等待時間可以證明出是最佳的,問題在於它是仰賴對於未來的猜測計算,作業系統必須事先「知道」每個行程的執行時間才能安排順序,但這是不可能的。因此,作業系統會根據一些經驗值和機率因子來推測,若推測與事實相差太遠,則SJF演算法的執行效能就會不如預期。

優先權(Priority)
原理是依照事先決定的優先權定義(例如期限、所需要的記憶體大小…等),計算出每個行程的優先順序,然後依照優先須序給予CPU使用權。

循環分配(RR, Round Robin)
原理是專為分時系統所設計,作業系統事先定義一個固定的時間配額,並將CPU時間劃分成一個個時間配額,再對每個行程執行完畢,下一次就再分配一個時間配額給它,而行程在時間配額用完後,就立刻交出CPU的使用權,讓下一個行程使用,重複這個過程直到行程結束為止。

2010年1月21日

作業系統的基本概念

作業系統(OS, Operating System)是介於電腦硬體與應用軟體之間的程式,除了提供執行應用軟體的環境,還負責分配系統資源。作業系統中實際負責管理系統資源的是數個不同的處理程式,而負責協調與控制這些處理程式,並維持整個作業系統正常運作的程式叫做核心(kernel)或監督程式(supervisor program)。核心是作業系統中最重要的程式,在電腦完成開機後,核心會常駐於記憶體,像這種常駐於記憶體的程式稱為常駐程式(resident),而在需要時才載入記憶體的程式則稱為非常駐程式(nonresident)。作業系統有以下三項主要的功能:

一、分配系統資源:
電腦經常會同時執行不同的程式或同時服務不同的使用者,這些程式或使用者就必須共同電腦的系統資源,而作業系統則必須扮演資源配置者的角色,負責協調與控制,將系統資源的分配與運用最佳化及公平化,進一步防止產生錯誤或不正確地使用電腦。
二、提供執行應用軟體的環境:
作業系統的重要功能之一是提供執行應用軟體的環境,以載入並執行應用軟體,做為應用軟體和電腦之間的橋樑,應用軟體無須瞭解如何驅動底層的硬體裝置,只要指定欲驅動的硬體裝置,作業系統就會代為驅動該裝置。
三、提供使用者介面:
使用者介面(user interface)是使用者和電腦硬體之間的橋樑,有時又稱為Shell。在過去,作業系統所提供的使用者介面是以命令列為主,使用者必須輸入指定的指令集,才能指揮電腦工作,如Unix、MS-Dos是屬於命令列使用者介面(command line user interface)。現在,作業系統所提供的使用者介面是以圖形化為主,如Windows、MacOS…等都屬於圖形化使用者介面(GUI, graphical user interface)。

作業系統的技術和膧腦硬體的發展息息相關,我們可以依照第一代到第四代電腦來做區分:
第一代電腦:由真空管所構成,並沒有作業系統的存在,必須以人工插卡的方式來進行工作。
第二代電腦:由電晶體所構成,輸入裝置是讀卡機,輸出裝置是打孔機,要執行工作,必須將程式、資料及控制訊息畫在固定格式的打孔卡片上,然後輸入電腦。這個時期的作業系統技術有單工系統、批次系統等。
第三代電腦:由積體電路(IC)所構成,電腦硬體大幅進步,這個時期所發展的作業系統技術有SPOOL、多元程式處理系統、分時系統等。
第四代電腦:採用超大型積體電路(VLSI)技術,微處理器的應用不侷限於電腦,還遍及家電或其它商業機器。這個時期的作業系統技術有多處理器系統、分散式系統、叢集式系統、即時系統、嵌入式系統、手持系統等。

批次系統
最早期的作業系統很簡單,就是將一個工作自動轉移到下一個工作,屬於單工系統(single task system),一次只能服務一位使用者,為了提昇效率,電腦的操作人員留下各個使用者的工作,透過工作控制程式(job control program)將這些工作加以排序,把相同或類似的工作集中在一起,稱為一個批次(batch),然後交給電腦分批執行,稱為批次處理(batch processing),用來進行批次處理的作業系統則稱為批次系統(batch system)。

線上同時週邊處理(SPOOL)
線上同同週邊處理(SPOOL, simultaneous peripheral operation on line)是把磁碟當成共用裝置,將所有等待執行的工作暫存於磁碟,再由控制程式依序從磁碟中讀取等待執行的工作加以處理。SPOOL的優點是可以協調各個速度不同的週邊裝置。

多元程式處理
多元程式處理(multiprogramming)的目的是同時服務多位使用者或多個程式,致力於讓CPU一直保持忙碌的狀態,以提昇CPU的使用率。在多元程式處理系統中,記憶體內會同時存放著多個工作,當所執行的工作在存取速度較慢的輸入/輸出裝置時,便會將CPU切換到記憶體內其它需要執行的工作,等之前的工作結束存取輸入/輸出裝置後,就會重新得到CPU,繼續尚未完成的工作,這樣CPU就能一直保持忙碌的狀態,而不會閒置下來。

分時系統
分時處理(time-sharing)是一種特殊形式的多元程式處理,倘若系統需要同時服務多位使用者,那麼可以將CPU時間分割成許多小段,稱為時間配額(time slice),輪流分配給各個使用者的工作,時間配額一到,無論目前的工作完成與否,都必須將CPU的使用權交給下一個工作,而尚未完成的工作再等CPU輪完一輪後又會回來,從中斷的地方繼續執行,這就是分時系統(time-sharing system),又稱為多工系統(multitasking system)。

多處理器系統
相對於多數系統只有一個CPU,也就是單處理器系統(single processor system),多處理器系統(multiprocessor system)則是擁有多個CPU的系統,這些CPU之間會緊密溝通,並共用匯流排、時脈、週邊裝置,甚至記憶體,又稱為平行系統(parallel system)或緊密耦合系統(tightly coupled system)。

分散式系統
網路的盛行造就了分散式系統(distributed system)的誕生,在分散式系統中,同一個工作可以拆成幾個部份,然後透過快速的網路連結指派給多部電腦分別執行,這些電腦或許位於不同的地點,之間透過Internet來聯繫。從使用者的觀點來看,他並不知道工作被分散到哪部電腦執行,所有分散的工作都是由分散式系統來執行。

叢集式系統
叢集式系統(clustered system)的特性類似多處理器系統,也是集合多個CPU一起完成工作,不過它們是由兩個或更多個別的系統集合而成,這些電腦會分享儲存裝置並經由區域網路連接在一起。

類別的繼承

繼承是物件導向程式設計最重要的特性之一,當我們已經創建一些類別後,就會發現在同一個範疇內如果再建立一些新的類別,將會出現大量的重複,新類別和已有類別大部分的屬性和方法都相同,此時有一種方法可以讓我們很方便以現有類別為基礎,快速生成新類別的方法,不需要重複定義相同的屬性和方法,提高程式碼的再使用性,這個方法就是繼承。在物件導向的程式設計中,我們把已有的基礎類別叫做父類別、基本類別,新的類別叫做子類別、衍生類別。子類別預設地從父類別繼承完全相同的屬性和方法,只是簡單地做一些父類別中沒有的擴展就可以了。

在PHP中,一個子類別只能從一個父類別中繼承資料,PHP不支援多重繼承。創建一個子類別時使用extends關鍵字來繼承一個父類別。在類別被定義時,存在三種限定詞(public、private和protected),其中private限定的屬性和方法是不能被繼承的。
private存取權限:如果類別的一個元素被設置成了private存取方式,那麼它將只對類別或者物件本身的內部成員開放。private元素對外部程式來說是被遮罩的,因而是不可見、不能被存取的。當前物件之外的任何類別、物件、程式都不能讀取其私有屬性的值,也不能呼叫私有方法,即使是衍生出的子類別也不能存取到其父類別的私有屬性和方法。
public存取權限:public元素則可以被毫無限制地存取,不管是在類別或者物件的內部還是外部,任何程式碼都可以讀寫public屬性的值,都可以呼叫public方法。在PHP中,如果類別的元素沒有指定存取方式,則預設是public的。
protected存取權限:與private元素相似,protected元素也不能被外部程式存取,但區別在於,protected元素可以被衍生的子類別存取到,而private元素則不行。一個使用protected方法的子類別需要很清楚其父類別的結構才可以。

PHP在同一個頁面和被包含的頁面中不能定義相同名稱的方法,在同一個類別中也不能定義相同名稱的方法。但是在繼承關系的兩個類別中,我們可以在子類別中定義與父類別同名的方法,這樣就把父類別中繼承過來的方法覆蓋掉了。通常父類別同名方法的程式碼內容很多,不可能就幾行,如果我們想保留原有的功能,另外再擴展出一點點的功能,但是又不想把原有的程式碼再重寫一次,這樣就可以使用"parent::"來呼叫父類別中被覆蓋的方法。這裡"::"是範圍解析運算子,用於在沒有宣告任何實體的情況下存取類別中的函式或基本類別中的函式和變數。使用parent存取父類別的成員,仍然受到public、protected、private限定詞的限制。

另外,在PHP的物件導向程式設計中還有抽象類別、介面甚至於是多形的概念,這些就以後有機會再說囉!!!

2010年1月20日

類別與物件的基本概念

物件導向的程式設計(OOP),是近年來日趨流行的程式設計架構,常常被用來作為設計大型軟體專案的解決方案,尤其是多人合作的項目。它的基本原則是將電腦程式的功能由單個能夠起作用的單元或物件通過組合來實現。為了實現整體運算,每個物件都能夠接收資訊、處理資料和向其他物件發送資訊。PHP並不是一個真正的物件導向的語言,PHP是一個混合型語言,你可以使用OOP,也可以使用傳統的程序導向程式設計。

類別(Class)的定義是:變數和作用於這些變數的函式的集合。我們可以把類別理解成為是對事物高度概括、歸納出來的抽象概念。如"人"是一個抽象的概念,"人"具備性別、姓名、國籍、民族、身高、血型、膚色等各種各樣的特徵,這些特徵,可以稱之為屬性(Attribute),"人"會有各種各樣的行為和動作,如吃飯、說話、工作、休息,這些行為和動作叫做方法(Method)。定義了各種屬性和方法的"人"就是一個"類別"。類別是具有相同屬性和服務的一組物件的集合,它為屬於該類別的所有物件提供了統一的抽象描述。在物件導向的程式設計語言中,類別是一個獨立的程式單位,它有一個類別名稱,並擁有屬性說明和方法說明兩個主要部分。

如果將"人"的性別、姓名、身高等特徵細化,給出具體的數值、名稱,並描述出這個人吃飯、說話的樣子,那麼一個活生生的個例就出現了;同理,當給一個類別的屬性賦予具體的值時,就生成了基於這個類別的一個實體,這個實體就叫做物件(Object)。物件是系統中用來描述客觀事物的一個實體,它是構成系統的一個基本單位。物件是類別的實體,所以類別中定義的屬性和方法均可被物件沿用。

在PHP之中,類別的創建通過關鍵字class來定義。所有的屬性和方法都被封閉在class所引導的大括弧中,在宣告變數時,須使用三個限定詞(public、private、protected)之一進行修飾,來定義變數的存取權限。當宣告屬性時,我們並不需要指明資料型態,變數可能是整數、字串或者是另一個物件,這需要根據實際情況來決定。類別的方法都是以函式的形式存在的,因此和普通函式一樣,通過function關鍵來定義。定義類別的方法時,也可以定義參數,如果宣告了這個方法有參數,則在呼叫此方法時必須傳遞參數給它,如果沒有傳遞參數,或者參數數量不足,都會導致程式出錯。如果傳遞的參數數量多於方法所定義的參數數量,PHP就會忽略多餘的參數。

如果想使用類別提供的功能,就需要把類別產生實體為物件。定義好一個類別之後,就可以使用關鍵字new來創建一個基於該類別的物件實體了,該實體也是一個變數,需要在物件名稱前加$。一個類別可以產生出多個物件,每個物件都是獨立的,每個物件之間是沒有聯繫的,只能說明它們都是這個類別的物件,每個物件都有自己單獨的屬性值。只要是類別裡面擁有成員屬性和成員方法,產生出來的物件中就會包含這些屬性和方法,當需要存取這些屬性變數時,用"->"運算子來引用它們。當呼叫這個物件的方法時也同樣。

2010年1月19日

建構PHP動態網頁

PHP、ASP、JSP等指令碼語言的作用不僅僅是使用它們提供的函式在伺服器上執行,更重要的是,它們提供了靜態網頁所不具備的與訪客互動的能力。訪客之所以能夠與網站的動態網頁互動,全靠HTML標準裡提供的用於訪客提交資訊的Web表單,使用表單,訪客就可以輸入、選擇各種資訊,並向伺服器提交。

HTML網頁中定義表單的標記是'<'form'>' '<'/form'>',這種標記需要成對出現,在兩者中間插入表單的其他元素或者HTML代碼。表單的創建老為了收集所需資料,使用了各種控制項,如text(輸入框)、select(下拉選擇框)、radio(選項按鈕)、chechbox(核取方塊)、button(按鈕)等,查看表單的使用者只需填寫資料並按下提交鈕即可向伺服器發送資料。表單中的元素可使用name屬性或id屬性,如果資料要發送到伺服器的話,那麼必須定義每個控制項元素的name屬性。form標記的幾個屬性如下。

□name:雖然表單的name屬性有沒有都可以提交出去,但JavaScript程式則必須通過form的name屬性或者id屬性來呼叫該表單。
□id:表單在網頁中的唯一識別碼,是獲取標識物件的字串。
□action:使用者填入表單的資訊需要程式來進行處理,action屬性就用來設置或獲取表單內容要發送處理的URL,而且只有定義了action才能把表單的內容傳送出去。
□method:表單有兩種向伺服器提交資料的方式,一種是GET,一種是POST。method屬性用來決定該表單使用何種方式向伺服器提交資料。

表單中所有需要輸入提交的資料,均應使用表單控制項。最常用的就是'<'input'>'輸入標記,該標記一般不需要成對出現,它需要設置的主要屬性是type。type屬性用於指出輸入標記的類型,有text(單行文字輸入框)、password(密碼輸入框)、submit(提交)、reset(重置)、button(按鈕)、radio(選項按鈕)、checkbox(核取方塊)、hidden(隱藏)、file(檔案上傳)、image(圖像)等十種常用的控制項。

為了在HTML代碼中嵌入PHP代碼,讓PHP代碼與普通的HTML代碼有所區分,規定所有的PHP程式碼片段以'<'? 或者 '<'?php 開始,以?'>'結束,這樣一來,就可以讓PHP代碼與HTML代碼共存了(此外還要注意檔的副檔名應當從html改為php)。

2010年1月18日

PHP的資料型態

PHP的資料型態屬於弱型態,PHP的變數在使用時可以根據具體情況自動轉換成所需要的變數型態

1.布林(Boolean)與NULL
布林型態是表示條件是真(非0)還是假(0)的資料型態,PHP將非0 數值都認為是true,將0 值認為是false。NULL資料型態表示一個沒有值的變數,NULL可以使用不區分大小寫的關鍵字NULL來表示。

2.字串(String)
在PHP之中,定義字串變數通常有兩種方法:
(1)單引號標示
PHP會將單引號裡面的所有內容當作字串來處理。
(2)雙引號標示
雙引號裡面的定義在輸出的時候是經過"解釋"的。
PHP裡最常用的輸出為echo和print。兩者除了名字不一樣,print具有傳回值,而echo沒有,所以echo比print 要快一些。另外,echo一次可以輸出多個字串,而print則不可以。

3.整數(integer)
整數是PHP中很常用的一個資料型態,整數值可以用十進位、十六進位(數值前必須加上0x)或八進位(數值前必須加上0)來表示。要將其他的資料型態轉換為integer,可用(int)或(integer)強制轉換,不過大多數情況下都會自動轉換。

4.浮點數(Float/Double)
也是是小數,浮點型資料的標記法有兩種:常用的小數,或是科學計數法的標記法。

5.陣列(Array)
陣列實際上是一個資料集合,相當於是一個資料容器。

6.物件(Object)
PHP是一種支持OOP(Object-Oriented Programming,物件導向程式設計)。類別(class)是物件導向程式設計的單元。類別是包含屬性和方法的結構定義,一個類別的實體稱之為物件。要創建一個物件,首先應該構建一個結構,即構建一個類別的定義,然後,就可以使用new關鍵字來創建任何數量的物件,並且所創建的物件可以使用"->"來存取類別的屬性和方法。