關系數據庫和 SQL · UCB DS100 數據科學的原理與技巧

# 關系數據庫和 SQL > 原文：[Relational Databases and SQL](https://www.textbook.ds100.org/ch/09/sql_intro.html) > > 校驗：[Kitty Du](https://github.com/miaoxiaozui2017) ```python # HIDDEN # Clear previously defined variables %reset -f # Set directory for data loading to work properly import os os.chdir(os.path.expanduser('~/notebooks/09')) ``` 到目前為止，我們已經處理了作為文本文件存儲在計算機上的數據集。雖然使用文本文件存儲數據對于分析小數據集很有用，但對許多實際用例來說卻是一個挑戰。許多數據集是由多個人收集的，例如，一個數據科學家團隊。但是，如果數據存儲在文本文件中，那么團隊可能需要在每次更新數據時發送和下載新版本的文件。文本文件本身并不能為多個分析員提供一致的數據檢索點。這個問題，以及其他問題，使得文本文件難以用于更大的數據集或團隊。我們經常使用關系數據庫管理系統（RDBMS）來存儲數據，如 MySQL 或 PostgreSQL。為了使用這些系統，我們使用一種稱為 SQL 的查詢語言，而不是 Python。在本章中，我們將討論關系數據庫模型并介紹 SQL。