文/北京集佳知識產(chǎn)權(quán)代理有限公司 馮柳偉
涉及人工智能的發(fā)明專利申請,有時需要在權(quán)利要求書中布局用于保護模型訓(xùn)練過程的權(quán)利要求。其中,權(quán)利要求書應(yīng)當(dāng)以說明書為依據(jù),清楚、簡要地限定要求專利保護的范圍。然而,因模型訓(xùn)練過程通常采用循環(huán)迭代方式進行實現(xiàn),因此如何清楚地撰寫出用于保護模型訓(xùn)練過程的權(quán)利要求是專利代理師在進行專利申請代理過程中需要著重考慮的問題。本文將結(jié)合圖1所示的模型訓(xùn)練過程分享一些撰寫方式以及這些撰寫方式的優(yōu)缺點。
撰寫方式一
1.一種模型訓(xùn)練方法,其特征在于,所述方法包括:
步驟1,獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù);
步驟2,對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結(jié)果;
步驟3,利用機器學(xué)習(xí)模型對所述第一處理結(jié)果進行第二處理,得到第二處理結(jié)果;
步驟4,判斷是否達到預(yù)設(shè)停止條件,若否,則依據(jù)所述第二處理結(jié)果和所述標(biāo)簽數(shù)據(jù)之間的差距,更新機器學(xué)習(xí)模型中的模型參數(shù),并繼續(xù)執(zhí)行所述步驟1至所述步驟4;若是,則保存或者使用所述機器學(xué)習(xí)模型執(zhí)行相應(yīng)的數(shù)據(jù)處理任務(wù)。
撰寫方式一的優(yōu)缺點以及建議
優(yōu)點:撰寫方式一能夠清楚的限定出所需保護的模型訓(xùn)練過程。
缺點:
(1)普適性弱,其理由為:如果模型訓(xùn)練過程中各個步驟之間的時序性比較弱,如一些步驟之間沒有必然的先后執(zhí)行順序等,則采用撰寫方式一所撰寫的權(quán)利要求容易無法覆蓋一些可能的實施方式,如此導(dǎo)致權(quán)利要求的保護范圍受到影響。
?。?)限定性太強,其理由為:①“判斷是否達到預(yù)設(shè)停止條件”這一步驟的執(zhí)行時間通常對模型訓(xùn)練效果所產(chǎn)生的影響不大,以使這一步驟的執(zhí)行時間可以靈活地設(shè)置,如設(shè)置在更新之前或者設(shè)置在更新之后等,從而使得采用撰寫方式一所撰寫的權(quán)利要求容易無法覆蓋一些可能的實施方式,如此導(dǎo)致權(quán)利要求的保護范圍受到影響。②非首輪訓(xùn)練過程中所執(zhí)行的步驟也是可以靈活設(shè)置的,如非首輪訓(xùn)練過程中所執(zhí)行的步驟包括圖1中S1-S4,或者,非首輪訓(xùn)練過程中所執(zhí)行的步驟包括圖1中S2-S4,如此使得采用撰寫方式一所撰寫的權(quán)利要求容易無法覆蓋一些可能的實施方式,從而導(dǎo)致權(quán)利要求的保護范圍受到影響。
?。?)不清楚,其理由為:因“判斷是否達到預(yù)設(shè)停止條件”這一技術(shù)特征中出現(xiàn)的“預(yù)設(shè)停止條件”這一內(nèi)容屬于自造詞,以使該技術(shù)特征無法準(zhǔn)確地表示出何時停止訓(xùn)練,從而使得采用撰寫方式一所撰寫的權(quán)利要求的保護范圍不清楚,進而使得日后可能會面臨一些風(fēng)險。
建議:除非必要,本文不推薦撰寫方式一。
撰寫方式二
1.一種模型訓(xùn)練方法,其特征在于,所述方法包括:
獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù);
對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結(jié)果;
利用機器學(xué)習(xí)模型對所述第一處理結(jié)果進行第二處理,得到第二處理結(jié)果;
依據(jù)所述第二處理結(jié)果和所述標(biāo)簽數(shù)據(jù)之間的差距,更新機器學(xué)習(xí)模型中的模型參數(shù),并繼續(xù)執(zhí)行所述獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù)的步驟及其后續(xù)步驟,直至在達到預(yù)設(shè)停止條件時,保存或者使用所述機器學(xué)習(xí)模型執(zhí)行相應(yīng)的數(shù)據(jù)處理任務(wù)。
撰寫方式二的優(yōu)缺點以及建議
優(yōu)點:相對于撰寫方式一,更簡要并且滿足“判斷是否達到預(yù)設(shè)停止條件”這一步驟的執(zhí)行時間的靈活性要求。
缺點:
(1)不清楚,其理由為:①因“繼續(xù)執(zhí)行所述獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù)的步驟及其后續(xù)步驟”這一技術(shù)特征中出現(xiàn)的“及其后續(xù)步驟”這一內(nèi)容比較含糊,如“其”這個字指代誰、“后續(xù)步驟”是指哪些步驟等,以使采用撰寫方式二所撰寫的權(quán)利要求的保護范圍不清楚,從而使得日后可能會面臨一些風(fēng)險。②因“在達到預(yù)設(shè)停止條件時”這一技術(shù)特征中出現(xiàn)的“預(yù)設(shè)停止條件”這一內(nèi)容屬于自造詞,以使該技術(shù)特征無法準(zhǔn)確地表示出何時停止訓(xùn)練,從而使得采用撰寫方式二所撰寫的權(quán)利要求的保護范圍不清楚,進而使得日后可能會面臨一些風(fēng)險。
?。?)限定性強,其理由為:非首輪訓(xùn)練過程中所執(zhí)行的步驟也是可以靈活設(shè)置的,如非首輪訓(xùn)練過程中所執(zhí)行的步驟包括圖1中S1-S4,或者,非首輪訓(xùn)練過程中所執(zhí)行的步驟包括圖1中S2-S4等,如此使得采用撰寫方式二所撰寫的權(quán)利要求容易無法覆蓋一些可能的實施方式,從而導(dǎo)致權(quán)利要求的保護范圍受到影響。
建議:除非必要,本文不推薦撰寫方式二。
撰寫方式三
1.一種模型訓(xùn)練方法,其特征在于,所述方法包括:
獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù);
對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結(jié)果;
利用機器學(xué)習(xí)模型對所述第一處理結(jié)果進行第二處理,得到第二處理結(jié)果;
依據(jù)所述第二處理結(jié)果和所述標(biāo)簽數(shù)據(jù)之間的差距,更新機器學(xué)習(xí)模型中的模型參數(shù),并繼續(xù)執(zhí)行所述獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù)的步驟,直至在達到預(yù)設(shè)停止條件時,保存或者使用所述機器學(xué)習(xí)模型執(zhí)行相應(yīng)的數(shù)據(jù)處理任務(wù)。
撰寫方式三的優(yōu)缺點以及建議
優(yōu)點:相對于撰寫方式一,更簡要并且滿足“判斷是否達到預(yù)設(shè)停止條件”這一步驟的執(zhí)行時間的靈活性要求;相對于撰寫方式二,克服了因“及其后續(xù)步驟”這一內(nèi)容所導(dǎo)致的不清楚。
缺點:
?。?)不清楚,其理由為:因“在達到預(yù)設(shè)停止條件時”這一技術(shù)特征中出現(xiàn)的“預(yù)設(shè)停止條件”這一內(nèi)容屬于自造詞,以使該技術(shù)特征無法準(zhǔn)確地表示出何時停止訓(xùn)練,從而使得采用撰寫方式三所撰寫的權(quán)利要求的保護范圍不清楚,進而使得日后可能會面臨一些風(fēng)險。
?。?)限定性強,其理由為:非首輪訓(xùn)練過程中所執(zhí)行的步驟也是可以靈活設(shè)置的,如非首輪訓(xùn)練過程中所執(zhí)行的步驟包括圖1中S1-S4,或者,非首輪訓(xùn)練過程中所執(zhí)行的步驟包括圖1中S2-S4等,如此使得采用撰寫方式三所撰寫的權(quán)利要求容易無法覆蓋一些可能的實施方式,從而導(dǎo)致權(quán)利要求的保護范圍受到影響。
建議:相較于撰寫方式一和撰寫方式二,本文更推薦撰寫方式三。
基于上文撰寫方式一、撰寫方式二以及撰寫方式三的相關(guān)內(nèi)容可知,這三種方式的部分或者全部缺點均來自于用于限定迭代循環(huán)這一過程的技術(shù)特征。然而,因通過迭代循環(huán)方式實現(xiàn)模型訓(xùn)練是一種比較常規(guī)的技術(shù)手段,以使涉及人工智能的發(fā)明專利申請的發(fā)明點通常很少出現(xiàn)在迭代循環(huán)方式上,而是大部分出現(xiàn)在其他地方,如類似于圖1中S2這類的用于對樣本數(shù)據(jù)進行前期處理的步驟和/或類似于圖1中S3這類的用于借助模型進行數(shù)據(jù)處理的步驟等地方;還因這些地方通常會出現(xiàn)在某一輪訓(xùn)練過程或者每一輪訓(xùn)練過程,故可以通過限定一輪訓(xùn)練過程的方式進行發(fā)明點保護?;诖?,本文給出了一種新的撰寫方式,也就是,下文撰寫方式四。
撰寫方式四
1.一種模型更新方法,其特征在于,所述方法包括:
獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù);
對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結(jié)果;
利用機器學(xué)習(xí)模型對所述第一處理結(jié)果進行第二處理,得到第二處理結(jié)果;
依據(jù)所述第二處理結(jié)果和所述標(biāo)簽數(shù)據(jù)之間的差距,更新機器學(xué)習(xí)模型中的模型參數(shù)。
撰寫方式四的優(yōu)缺點以及建議
優(yōu)點:
?。?)相對于撰寫方式一至撰寫方式三,更簡要并且克服了這些撰寫方式的所有缺點。
(2)擴大了保護范圍,其理由為:因“一種模型更新方法”這一技術(shù)特征只是限定了權(quán)利要求所保護的方法用于實現(xiàn)模型更新處理,未限定應(yīng)用領(lǐng)域必須是模型訓(xùn)練這一領(lǐng)域,以使該權(quán)利要求所保護的方法適用于任一具有模型更新需求的領(lǐng)域。
缺點:撰寫方式四不適于保護迭代更新方式方面的發(fā)明點。
建議:相較于撰寫方式一、撰寫方式二、以及撰寫方式三,本文更推薦撰寫方式四。
另外,對于上文撰寫方式一、撰寫方式二、撰寫方式三以及撰寫方式四來說,這四種撰寫方式均涉及了“更新機器學(xué)習(xí)模型中的模型參數(shù)”這一技術(shù)特征,而且這個技術(shù)特征能夠準(zhǔn)確地限定出模型更新時需要更新什么信息。然而,隨著人工智能技術(shù)的不斷發(fā)展,模型的更新不再局限于通過參數(shù)更新的方式進行實現(xiàn),還可以通過增加網(wǎng)絡(luò)模塊的方式,如lora微調(diào)進行實現(xiàn),以使“更新機器學(xué)習(xí)模型中的模型參數(shù)”這一技術(shù)特征無法涵蓋這種新增的模型更新方式?;诖耍疚慕o出了一種新的撰寫方式,也就是,下文撰寫方式五。
撰寫方式五
1.一種模型更新方法,其特征在于,所述方法包括:
獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應(yīng)的標(biāo)簽數(shù)據(jù);
對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結(jié)果;
利用機器學(xué)習(xí)模型對所述第一處理結(jié)果進行第二處理,得到第二處理結(jié)果;
依據(jù)所述第二處理結(jié)果和所述標(biāo)簽數(shù)據(jù)之間的差距,更新機器學(xué)習(xí)模型。
撰寫方式五的優(yōu)缺點以及建議
優(yōu)點:克服了上文“更新機器學(xué)習(xí)模型中的模型參數(shù)”這一技術(shù)特征所導(dǎo)致的缺陷,如無法涵蓋通過增加網(wǎng)絡(luò)模塊方式實現(xiàn)模型更新的技術(shù)方案。
缺點:撰寫方式五不適于保護迭代更新方式方面的發(fā)明點。
建議:相較于撰寫方式一、撰寫方式二、撰寫方式三以及撰寫方式四,本文更推薦撰寫方式五。
基于上文五種撰寫方式的相關(guān)內(nèi)容可知,對于涉及人工智能的發(fā)明專利申請來說,如果該申請的發(fā)明點能夠借助一輪訓(xùn)練過程說清楚,則可以采用上文撰寫方式五撰寫該申請的獨立權(quán)利要求;如果該申請的發(fā)明點必須借助多輪訓(xùn)練過程才能說清楚,則可以優(yōu)先選擇類似于上文撰寫方式三的撰寫方式撰寫該申請的獨立權(quán)利要求;如果該申請的發(fā)明點不涉及模型更新內(nèi)容,則可以選擇使用“更新機器學(xué)習(xí)模型”這一技術(shù)特征撰寫該申請的獨立權(quán)利要求。
以上是筆者的一些個人經(jīng)驗總結(jié),如有不妥之處,還請讀者批評指教。