ChatGPT 4 有多好?我們分析它對四個問題的答案
Posted: Mon Dec 02, 2024 10:54 am
自 2022 年底以來,人們很難避免在網路上或當面提及 ChatGPT,而且圍繞它的熱議絲毫沒有減弱的跡象。來自美國人工智慧研究公司 OpenAI 的自然語言處理工具/聊天機器人引起了轟動,它似乎終於兌現了人工智慧的承諾,提供豐富的對話體驗,主題範圍廣泛(甚至包括生成電腦程式碼的能力)。
經過多次預發佈內部開發後,基於 3.5 版本的 Chat GPT 於 2022 年 11 月 30 日首次公開發布。
我們對 Chat GPT 4 進行了測試,問題旨在測試其理解能力、知識基礎和答案的相關性。
就像許多大肆宣傳的新技術一樣,我們一開始並不確定會發生什麼。結果很有趣,人工智慧理解複雜問題並給出相關回應的能力的複雜性超出了我們的預期,儘管我們發現它並非沒有怪癖和限制。
聊天 GPT 4.0 通常以偽文章的形式給予多段回應。它的答覆比 A-Level 或學位考試大廳可能要求的完整論文要短得多,但比小學試卷的各個部分所允許的空間要長,該試卷分為許多簡短的問題,每個問題都值得2 -4分。儘管如此,與學術考試問題的比較似乎是相關的,因為它的答案是公式化的,並且通常以一種可能期望對此類問題做出平衡回答的風格來構建,考慮多個角度,並且在許多情況下包括引言和結論。我們的評估是,它被故意編程為以這種方式回答,以便其回答顯得更具權威性,也許可以作為面臨學校或大學課程實際問題的學生的大綱模型,並使Chat GPT 的使用對此類學生更具吸引力。
在本文的每一部分中,我們將提供 Chat GPT 對我們的四個問題的答覆記錄,並對其性能的優缺點進行總結評估,然後再給予他們從 A 到 E 的等級。在我們一系列問題中的表現有何看法。我們很想聽聽您對這個流行系統的想法。
1. 誰是更偉大的哲學家:洛克或萊布尼茲?
GPT 4.0
約翰·洛克和戈特弗里德·威廉·萊布尼茨之間誰是「更偉大」的哲學家的問題有些主觀,因為它可能取決於做出判斷的人的個人信念、價值觀和興趣。他們對哲學的不同領域做出了重大貢獻,他們的思想產生了不同的影響。
約翰·洛克(1632-1704)是經驗主義哲學傳統的核心人物,強調透過感官獲得的經驗和證據在知識形成中的作用。他的著作為啟蒙思想奠定了基礎,並極大地影響了政治哲學的發展。他關於社會契約和個人權利的思想對政治制度的發展,特別是民主傳統產生了深遠的影響。他的《關於人類理解的論文》是知識論和心靈哲學的關鍵文本。
另一方面,戈特弗里德·威廉·萊布尼茨(Gottfried Wilhelm Leibniz,1646-1716)是一位博學者,對哲學、數學和科學做出了重大貢獻。在哲學方面,他最出名的是形上學和邏輯學的工作。他提出了單子的概念,單子是構成宇宙的簡單物質。他也對符號邏輯的發展做出了重大貢獻,並被認為是數學微積分的共同發明者(獨立於艾薩克·牛頓爵士)。
因此,如果您對政治哲學和經驗主義更感興趣,您可能會發現洛克是「更偉大」的哲學家。如果您的興趣更在於形而上學、邏輯或哲學與數學的交叉點,您可能會發現萊布尼茨更重要。
同樣重要的是要注意,哲學中的「偉大」不僅僅在於誰擁有「正確」的想法。它還涉及誰有有趣的、有影響力的和發人深省的想法。洛克和萊布尼茲無疑都符合這些標準。
分析:
Chat GPT 從一開始就毫不費力地識別出問題中洛克和萊布尼茨所暗示的人是誰,這表明他們的姓氏與其職業相結合足以識別相關個人,以便做出回應。
從一開始就正確地認識到,在某個特定領域因貢獻而聞名的兩個人中,哪一個更大的問題有些主觀。這是一個相關的觀察:想像一種情況,向作家或另一位哲學家提出同樣的問題,並考慮他們的答案將如何受到他們自己的價值觀、生活經驗和觀點的影響。因此,在這裡,ChatGPT 成功地認識到,首選的哲學家會根據詢問的對象而有所不同。它也成功地認識到洛克和萊布尼茨的哲學著作通常並不涉及哲學中完全相同的主題這一細微差別。
這就是說,它用來表達任何此類比較的相對主義的語言都偏離了界限。一篇好的學術論文應該是直接、準確、簡潔的,用字表達意思。 「他們的想法產生了不同類型的影響」這個表述是模糊的,無法確定他們的想法產生了哪些影響,而在這種情況下,學術文章應該對此進行解釋。
洛克和萊布尼茨分別撰寫的哲學領域的總結就目前而言似乎是合理的。也就是說,這是粗略的,並不能解釋為什麼他們在所寫的每個領域各自的工作值得被認為是「偉大的」。這是響應不足的主要領域。如果你要承認某個歷史人物在某個特定領域取得的偉大成就,你應該提供支持性論點來證明為什麼他們在這些領域的工作被認為是高品質或高標準的。相反,Chat GPT 使用了太多陳詞濫調,例如“是中心人物”、“是關鍵文本”和(兩次)“做出了重大貢獻”,而沒有用任何具體細節來證明它們的合理性。
一個好的答案應該詳細說明洛克和萊布尼茨在他們所著述的每個領域的工作如何突破新的知識領域,並建立在同一領域的早期作家所奠定的基礎上。這還沒完成。
最後一段特別軟弱不置可否。它非正式地將讀者稱為“你”,這在學術寫作中被認為是糟糕的風格,而不是提供一個總結案例來說明為什麼任一哲學家可以被認為是更偉大的整體,或者為什麼他們可以被認為在各 薩爾瓦多電話號碼數據 自的領域同樣偉大,它只是將問題引回讀者對每位哲學家所著述的不同哲學領域的相對興趣水平。它似乎迴避了對答案提供明確意見的挑戰,這又與人類寫下答案時答案的結局有很大不同。這種判斷失誤的結論應該招致任何有能力、有經驗的審查員的譴責。
等級:D
2. 傑羅拉莫·卡爾達諾為何入獄?
GPT 4.0
傑羅拉莫·卡爾達諾(Gerolamo Cardano,1501-1576 年)是一位著名的意大利博學家,因其對數學、醫學、物理學和占星學的貢獻而聞名,他確實於1570 年入獄。他入獄的原因與他的學術著作沒有直接關係,而是與異端罪名。
導致卡爾達諾入獄的具體事件涉及他的書《De Vita Propria》(《他自己的生活》)的出版。在這本自傳中,他承認為耶穌基督算命,宗教裁判所認為這是褻瀆神靈的行為,宗教裁判所是天主教會的一個機構,負責識別和消除異端。
儘管卡爾達諾對各個知識領域做出了重大貢獻,但他的個人生活卻很混亂,其特點是孩子的不幸和他自己與心理健康的鬥爭。他的監獄生涯是他一生中戲劇性的事件之一。隔年,即 1571 年,他出獄,並搬到羅馬,在教宗格列高利十三世的庇護下居住。
經過多次預發佈內部開發後,基於 3.5 版本的 Chat GPT 於 2022 年 11 月 30 日首次公開發布。
我們對 Chat GPT 4 進行了測試,問題旨在測試其理解能力、知識基礎和答案的相關性。
就像許多大肆宣傳的新技術一樣,我們一開始並不確定會發生什麼。結果很有趣,人工智慧理解複雜問題並給出相關回應的能力的複雜性超出了我們的預期,儘管我們發現它並非沒有怪癖和限制。
聊天 GPT 4.0 通常以偽文章的形式給予多段回應。它的答覆比 A-Level 或學位考試大廳可能要求的完整論文要短得多,但比小學試卷的各個部分所允許的空間要長,該試卷分為許多簡短的問題,每個問題都值得2 -4分。儘管如此,與學術考試問題的比較似乎是相關的,因為它的答案是公式化的,並且通常以一種可能期望對此類問題做出平衡回答的風格來構建,考慮多個角度,並且在許多情況下包括引言和結論。我們的評估是,它被故意編程為以這種方式回答,以便其回答顯得更具權威性,也許可以作為面臨學校或大學課程實際問題的學生的大綱模型,並使Chat GPT 的使用對此類學生更具吸引力。
在本文的每一部分中,我們將提供 Chat GPT 對我們的四個問題的答覆記錄,並對其性能的優缺點進行總結評估,然後再給予他們從 A 到 E 的等級。在我們一系列問題中的表現有何看法。我們很想聽聽您對這個流行系統的想法。
1. 誰是更偉大的哲學家:洛克或萊布尼茲?
GPT 4.0
約翰·洛克和戈特弗里德·威廉·萊布尼茨之間誰是「更偉大」的哲學家的問題有些主觀,因為它可能取決於做出判斷的人的個人信念、價值觀和興趣。他們對哲學的不同領域做出了重大貢獻,他們的思想產生了不同的影響。
約翰·洛克(1632-1704)是經驗主義哲學傳統的核心人物,強調透過感官獲得的經驗和證據在知識形成中的作用。他的著作為啟蒙思想奠定了基礎,並極大地影響了政治哲學的發展。他關於社會契約和個人權利的思想對政治制度的發展,特別是民主傳統產生了深遠的影響。他的《關於人類理解的論文》是知識論和心靈哲學的關鍵文本。
另一方面,戈特弗里德·威廉·萊布尼茨(Gottfried Wilhelm Leibniz,1646-1716)是一位博學者,對哲學、數學和科學做出了重大貢獻。在哲學方面,他最出名的是形上學和邏輯學的工作。他提出了單子的概念,單子是構成宇宙的簡單物質。他也對符號邏輯的發展做出了重大貢獻,並被認為是數學微積分的共同發明者(獨立於艾薩克·牛頓爵士)。
因此,如果您對政治哲學和經驗主義更感興趣,您可能會發現洛克是「更偉大」的哲學家。如果您的興趣更在於形而上學、邏輯或哲學與數學的交叉點,您可能會發現萊布尼茨更重要。
同樣重要的是要注意,哲學中的「偉大」不僅僅在於誰擁有「正確」的想法。它還涉及誰有有趣的、有影響力的和發人深省的想法。洛克和萊布尼茲無疑都符合這些標準。
分析:
Chat GPT 從一開始就毫不費力地識別出問題中洛克和萊布尼茨所暗示的人是誰,這表明他們的姓氏與其職業相結合足以識別相關個人,以便做出回應。
從一開始就正確地認識到,在某個特定領域因貢獻而聞名的兩個人中,哪一個更大的問題有些主觀。這是一個相關的觀察:想像一種情況,向作家或另一位哲學家提出同樣的問題,並考慮他們的答案將如何受到他們自己的價值觀、生活經驗和觀點的影響。因此,在這裡,ChatGPT 成功地認識到,首選的哲學家會根據詢問的對象而有所不同。它也成功地認識到洛克和萊布尼茨的哲學著作通常並不涉及哲學中完全相同的主題這一細微差別。
這就是說,它用來表達任何此類比較的相對主義的語言都偏離了界限。一篇好的學術論文應該是直接、準確、簡潔的,用字表達意思。 「他們的想法產生了不同類型的影響」這個表述是模糊的,無法確定他們的想法產生了哪些影響,而在這種情況下,學術文章應該對此進行解釋。
洛克和萊布尼茨分別撰寫的哲學領域的總結就目前而言似乎是合理的。也就是說,這是粗略的,並不能解釋為什麼他們在所寫的每個領域各自的工作值得被認為是「偉大的」。這是響應不足的主要領域。如果你要承認某個歷史人物在某個特定領域取得的偉大成就,你應該提供支持性論點來證明為什麼他們在這些領域的工作被認為是高品質或高標準的。相反,Chat GPT 使用了太多陳詞濫調,例如“是中心人物”、“是關鍵文本”和(兩次)“做出了重大貢獻”,而沒有用任何具體細節來證明它們的合理性。
一個好的答案應該詳細說明洛克和萊布尼茨在他們所著述的每個領域的工作如何突破新的知識領域,並建立在同一領域的早期作家所奠定的基礎上。這還沒完成。
最後一段特別軟弱不置可否。它非正式地將讀者稱為“你”,這在學術寫作中被認為是糟糕的風格,而不是提供一個總結案例來說明為什麼任一哲學家可以被認為是更偉大的整體,或者為什麼他們可以被認為在各 薩爾瓦多電話號碼數據 自的領域同樣偉大,它只是將問題引回讀者對每位哲學家所著述的不同哲學領域的相對興趣水平。它似乎迴避了對答案提供明確意見的挑戰,這又與人類寫下答案時答案的結局有很大不同。這種判斷失誤的結論應該招致任何有能力、有經驗的審查員的譴責。
等級:D
2. 傑羅拉莫·卡爾達諾為何入獄?
GPT 4.0
傑羅拉莫·卡爾達諾(Gerolamo Cardano,1501-1576 年)是一位著名的意大利博學家,因其對數學、醫學、物理學和占星學的貢獻而聞名,他確實於1570 年入獄。他入獄的原因與他的學術著作沒有直接關係,而是與異端罪名。
導致卡爾達諾入獄的具體事件涉及他的書《De Vita Propria》(《他自己的生活》)的出版。在這本自傳中,他承認為耶穌基督算命,宗教裁判所認為這是褻瀆神靈的行為,宗教裁判所是天主教會的一個機構,負責識別和消除異端。
儘管卡爾達諾對各個知識領域做出了重大貢獻,但他的個人生活卻很混亂,其特點是孩子的不幸和他自己與心理健康的鬥爭。他的監獄生涯是他一生中戲劇性的事件之一。隔年,即 1571 年,他出獄,並搬到羅馬,在教宗格列高利十三世的庇護下居住。