PodcastsBusinessStellaxAmy·自定義 Podcast

StellaxAmy·自定義 Podcast

StellaxAmy
StellaxAmy·自定義 Podcast
Latest episode

97 episodes

  • StellaxAmy·自定義 Podcast

    [全英文] Next Level AI Evals for 2026

    24/04/2026 | 53 mins.
    這是 Stella 最近與 Hugo Bowne-Anderson 和 Eddie Landesberg 在 Vanishing Gradients Podcast 上的一次對話,圍繞當下真實產品環境中的 AI evals(AI評測)展開。

    在這期節目中,我們從實踐出發,分享了為什麼 AI evals 在產品中如此關鍵:
    一方面,它是開發階段的“指南針”,幫助團隊不斷迭代、建立有效的反饋閉環;
    另一方面,它又是發佈前的“關卡”,支持團隊做出系統是否可以上線或進入實驗階段的決策。

    我們討論了:
    1. 團隊協同的 AI 評測(Team-Centric AI Evals)
    如何讓產品經理、數據科學家以及領域專家(SMEs)協同參與評測過程,
    在“統一決策者”(benevolent dictator)或去中心化模式之間找到平衡,
    從而構建更全面、更有效的評測體系。
    2. 定制化評測指標(Custom Evaluation Metrics)
    為什麼不能只依賴工具廠商提供的通用指標,
    而需要回到原始數據,識別具體的失敗模式(failure modes),
    避免用“看起來不錯”的指標掩蓋真實問題。
    3. AI評測作為“策略評測”(AI as Policy Evaluation)
    將評測問題轉化為因果推斷問題:
    評測不同“策略”(如prompt、模型)的反事實表現(counterfactual performance),
    並預測線上A/B實驗的結果。
    4. 明確產品邊界與約束(Clear Product Constraints)
    定義AI產品“不能做什麼”往往比“能做什麼”更重要:
    通過嚴格的guardrails防止濫用、控製成本,並保護品牌。
    5. 校准後的 LLM 評測器(Calibrated LLM Judges)
    如何通過統計方法和因果推斷,將 LLM-as-a-judge 與人類專家對齊,
    確保評測結果能夠真實反映用戶價值和業務目標。
    6. 數據直覺與好奇心(Essential Data Curiosity)
    在依賴自動化分析或agent之前,
    先通過人工查看數據建立直覺,
    這是設計有效評測系統的基礎能力。
    7. 統計視角下的 AI 評測(Statistical AI Evaluation)
    從“單元測試思維”轉向“分布思維”:
    利用置信區間(confidence intervals)和統計功效分析(power analysis),
    區分真實改進與統計噪聲。
    8. 前瞻性的合規設計(Proactive Regulatory Compliance)
    在監管尚不明確的階段,
    提前建立嚴謹、可解釋的內部評測標準,
    為未來合規要求做好準備,並形成競爭優勢。
    9. 以人為中心的評測基準(Human-Centric Benchmarking)
    將AI系統建立在人類判斷與用戶價值之上,
    不僅僅依賴自動化分數,
    而是構建真正有韌性、差異化的AI產品。

    留言告訴我你對這一集的想法: https://open.firstory.me/user/cls5sglrw05pc01tr4h0v4ufn/comments

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting
  • StellaxAmy·自定義 Podcast

    EP91: 停著的23小時,才是美國電車真正的商機

    14/04/2026 | 1h 2 mins.
    油價飆升,你慶幸自己開的是電動車嗎?還是正在考慮買一台?本集我們邀請到 Pando Electric 創辦人 Aaron,他對電車情有獨鍾,經歷蘋果、蔚來的電車項目,如今在創業,為美國小區和大樓的車子充電,從能源管理的角度,解決電車普及帶來的基礎設施缺口。

    Pando Electric: https://www.pandoelectric.com/

    Aaron 是 Pando Electric 的共同創辦人。北大物理系出身,博士畢業後進入蘋果,從手錶做到自動駕駛部門,再轉戰蔚來;走了一圈之後,他發現電動車這場革命裡,最被低估的機會不在車本身,而在於電:如何儲、如何分配、如何在不增加電網負擔的前提下,讓每一輛停著的電車都「有事可做」。Pando Electric 的核心概念,是把電車每天停著的那23小時變成能源調度的窗口。

    本集我們深聊了美中電動車充電市場的結構差異、為什麼超充其實並不環保也不經濟、多戶住宅(multi-family communities)的充電困境為何是美國最大的未解痛點,以及在政策不確定的當下,一家能源新創如何定義自己的節奏與邊界。

    對能源轉型、電車產業、或者創業如何在混沌中找到正確的事持續做感興趣嗎?希望
    你喜歡這集的分享!

    00:00:00 高光、歡迎 Aaron
    00:01:48 電動車之路:從蘋果、蔚來到創業的緣由
    00:05:40 為什麼選擇能源切入,而非做自動駕駛
    00:08:50 電車普及帶來的能源缺口:KW 與 KWH 的根本挑戰
    00:17:19 終局願景:電車作為能源水庫
    00:19:30 中美電動車市場三大結構性差異
    00:25:51 為什麼鎖定多戶住宅?美國充電困境的真實面貌
    00:35:27 Pando Electric 的競爭優勢
    00:40:34 Pando Electric 三個產品方向:硬件、軟體、分散式儲能
    00:49:02 創業的節奏:耐心是最大挑戰
    00:58:38 AI 時代能源缺口的機遇,以及 Pando Electric 的長遠願景
    01:00:16 招聘與聯絡方式

    留言告訴我你對這一集的想法:

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting
  • StellaxAmy·自定義 Podcast

    EP90: 雙重人生:白天博彩業做數據分析 晚上說段子

    31/03/2026 | 1h 20 mins.
    Shawn是一位活躍於多倫多的脫口秀演員,同時也是Hard Rock Digital的Analytics Team Lead (正在招人!)。本集他和Stella、Amy聊了從加拿大Tim Hortons等食品業跳槽到美國合法博彩產業的做數據分析的心路歷程。如何找到自己在市場上的niche技能、博彩業和Data Science的意外契合,以及為什麼「數據人的Dream Job可能不在大廠」。喜劇生涯和科技工作,究竟能不能共存?

    Shawn的IG: https://www.instagram.com/shawndoescomedy

    Shawn同時身兼脫口秀演員和資深數據分析師兩個身份。他靠聽Dave Chappelle的單口喜劇自學英文、被朋友推上舞台開始了喜劇生涯;他也從食品業出發,靠著niche的數據分析特長敲開了博彩科技公司的門。本期節目,也為我們揭開了博彩行業的神秘面紗:它的市場規模、數據深度、監管邏輯、以及為什麼Data在這裡比很多傳統行業更受重視。

    00:00:00 節目高光|歡迎Shawn
    00:01:57 喜劇起點、靠Stand Up學英文、英文中文寫段子的差異
    00:09:01 Austin:喜劇聖城的真實氣氛
    00:11:26 北美 vs 中國喜劇產業生態比較
    00:15:23 在食品行業做數據人?
    00:20:24 喜劇表演能提升溝通技巧嗎?
    00:22:07 博彩產業三大分類介紹(Fantasy / Sportsbook / Online Casino)
    00:25:46 三大市場規模比較・各州合法化差異
    00:30:57 博彩app 驚人的用戶滲透率
    00:33:36 博彩業利潤
    00:45:21 博彩業本質是設計體驗,而不是odds
    00:49:51 數據分析師的dream job
    01:02:10 加拿大 vs 美國工作文化
    01:05:54 如何分辨合法 vs 非法博彩公司
    01:12:12 對大廠的祛魅
    01:17:43 Starving Artist的迷思


    留言告訴我你對這一集的想法:

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting
  • StellaxAmy·自定義 Podcast

    EP89: 走過.com泡沫與08金融危機: 三十年科技老兵如何應對AI浪潮?

    17/03/2026 | 1h 27 mins.
    ** 本期是Stella和Amy第二次全英語podcast!

    擁有30年科技產業經歷的Jeff Chen,走過半導體、資安、教育科技、AI策略等多個領域,曾負責HP全球高等教育AI策略。本集他與Stella、Amy深度對話:從一個橫跨HP、Alibaba、Intel三方的中國教育數位化大案,到親身經歷 .com泡沫破裂的故事,再到今天求職困境的第一手心得——一個在科技大浪裡反覆轉型的人,怎麼思考職涯?

    Jeff Chen在1996年從Carnegie Mellon畢業後,從Qualcomm的半導體晶片設計做起,一路走過.com泡沫、矽谷創業、安全科技,最後在HP負責全球高等教育AI策略超過十年。這段職涯軌跡本身就是一份跨域進化的教科書:每一次轉折不是放棄,而是累積。Jeff對在職場中段的三四十代給出了最實用的建議:成為T型人才,讓每一次轉型加分而非歸零。

    🎙️ 「StellaxAmy‧自定義」Podcast
    每期邀請一位朋友,講述中文世界故事、華人故事。和我們一起傾聽自定義人生。

    如果你喜歡本節目或希望與我們合作,Stella和Amy現已開通Buy Me a Coffee會員支持:
    ☕️ 請我們喝杯咖啡
    👩🏻‍🏫 找我們咨詢/創業陪跑
    👉 https://buymeacoffee.com/stellaxamy
    📌 訂閱收聽:

    不要錯過任何一集精彩內容!如果我們的節目對你有啓發,請記得給我們五星好評鼓勵!
    🍎 Apple Podcasts
    🎧 Spotify
    📺 YouTube
    🪐 小宇宙
    🌐 或你喜歡的任何Podcast平台
    👉 https://linktr.ee/stellaxamy

    留言告訴我你對這一集的想法:

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting
  • StellaxAmy·自定義 Podcast

    EP88: Legal AI 爆火背後:為什麼律師還是不買帳?

    03/03/2026 | 1h 14 mins.
    這一集我們邀請了兩位律師朋友,分別來自:
    創投/併購/公司法領域

    國際信託與遺產規劃(高資產客戶的稅務規劃與資產傳承)

    當 Legal AI 在 2025 年被炒到風頭浪尖,Harvey 估值高達 80 億美元,資本瘋狂湧入—— 我們想問一個最現實的問題:
    「AI 真的能取代律師嗎?」
    從 billable hour(計費工時)、法律檢索、合約撰寫,到「灰色地帶(gray area)」裡的風險判斷,我們拆解了律師真實的工作流程,也聊了 Legal AI 的理想與現實落差。

    這一集你會聽到:
    為什麼律師對 AI 的「不信任」比你想像得更深?

    法律產業為什麼容錯空間極低?

    「幻覺(hallucination)」在法律場景到底有多致命?

    Legal AI 的未來是取代律師,還是輔助律師?

    如果有第三方 AI 評測報告,律師會更願意嘗試嗎?

    答案依然是那句經典:
    It depends.
    時間軸
    00:00:00 本集高光
    00:07:11 律師職涯路徑:Junior / Senior / Partner
    00:12:36 Deal 現場:簽名頁的緊張時刻
    00:14:30 什麼是 Billable Hour(計費工時)?
    00:17:17 律所的工作強度
    00:21:55 In-house vs 律所:效率邏輯差在哪?
    00:28:02 Legal AI 在合約裡可能怎麼用?
    00:30:20 文件生成工具的侷限
    00:35:04 稅務規劃裡的「reasonable position」
    00:39:42 律師怎麼做法律檢索
    00:40:00 AI 做法律檢索的幻覺問題
    00:42:58 RAG 系統能幫助法律檢索嗎?
    00:49:12 Harvey AI 的創業故事
    00:55:32 AI 幫律師寫 Email 真的靠譜嗎?
    01:08:00 Legal AI 的未來:取代還是輔助?
    01:12:22 灰色地帶(Gray Area):AI 能承擔風險嗎?



    留言告訴我你對這一集的想法:

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting

More Business podcasts

About StellaxAmy·自定義 Podcast

原「數據女孩的中年危機」Podcast。現「StellaxAmy·自定義」Podcast。每期和我們一起認識一位新朋友,傾聽自定義人生。 ◆ 找我們諮詢、加入會員:https://buymeacoffee.com/stellaxamy ◆ 找我們聊天合作 歡迎來信:[email protected]   歡迎留下評價還有留言!我們都有看喔 ♫ Powered by Firstory Hosting
Podcast website

Listen to StellaxAmy·自定義 Podcast, Prof G Markets and many other podcasts from around the world with the radio.net app

Get the free radio.net app

  • Stations and podcasts to bookmark
  • Stream via Wi-Fi or Bluetooth
  • Supports Carplay & Android Auto
  • Many other app features