檔案格式
有些檔案格式被設計用於存儲特殊的數據,例如:圖像檔案中的JPEG檔案格式僅用於存儲靜態的圖像,而GIF既可以存儲靜態圖像,也可以存儲簡單動畫;Quicktime格式則可以存儲多種不同的媒體類型。文本類的檔案有:text檔案一般僅存儲簡單沒有格式的ASCII或Unicode的文本;HTML檔案則可以存儲帶有格式的文本;PDF格式則可以存儲內容豐富的,圖文並茂的文本。同一個檔案格式,用不同的程式處理可能產生截然不同的結果。例如Word檔案,用MicrosoftWord觀看的時候,可以看到文本的內容,而以無格式方式在音樂播放軟體中播放,產生的則是噪聲。一種檔案格式對某些軟體會產生有意義的結果,對另一些軟體來看,就像是毫無用途的數字垃圾。
許多檔案格式都有公開的、不同程度規範或者建議的格式。這些規範或者建議描述了數據如何編碼,如何排列。有時也規定了是否需要特定的電腦程式讀取或處理。有兩種情況下,檔案格式沒有公開。第一種情況是:開發者將檔案格式視作商業秘密不願公開;第二種情況是:開發者不願或花去很少的時間用於規範文檔。
需要注意的是,使用不公開的檔案格式可能會帶來額外的成本。要了解這類檔案格式或者需要通過對獲得的檔案進行逆向工程,或者通過向開發者付費來獲得檔案的格式。第二種方式中往往還需要與開發者簽訂不擴散協定。不論怎樣兩種方式都是費時,費錢的。
擴展名
用擴展名識別檔案格式的方式最先在數字設備公司的CP/M作業系統被採用。而後又被DOS和Windows作業系統採用。擴展名是指檔案名稱中,最後一個點(.)號後的字母序列。例如,HTML檔案通過.htm或.html擴展名識別;GIF圖形檔案用.gif擴展名識別。在早期的FAT檔案系統中,擴展名限制只能是三個字元,因此儘管現在絕大多數的作業系統已不再有此限制,許多檔案格式至今仍然採用三個字元作擴展名。因為沒有一個正式的擴展名命名標準,所以,有些檔案格式可能會採用相同的擴展名,出現這樣的情況就會使作業系統錯誤地識別檔案格式,同時也給用戶造成困惑。
擴展名方式的一個特點是,更改檔案擴展名會導致系統誤判檔案格式。例如,將filename.html簡單改名為filename.txt會使系統誤將HTML檔案識別為純文本格式。儘管一些熟練的用戶可以利用這個特點,但普通用戶很容易在改名時發生錯誤,而使得檔案變得無法使用。因此,現代的有些作業系統管理程式,例如WindowsExplorer加入了限制向用戶顯示檔案擴展名的功能。