西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
軟件
軟件
文章
搜索

首頁西西教程數(shù)據(jù)庫(kù)教程 → SQL Server 2008 數(shù)據(jù)挖掘新功能實(shí)現(xiàn)

SQL Server 2008 數(shù)據(jù)挖掘新功能實(shí)現(xiàn)

相關(guān)軟件相關(guān)文章發(fā)表評(píng)論 來源:MSDN時(shí)間:2010/9/30 17:05:22字體大。A-A+

作者:佚名點(diǎn)擊:534次評(píng)論:0次標(biāo)簽: SQLServer2008 數(shù)據(jù)挖掘

  • 類型:數(shù)據(jù)庫(kù)類大小:10.5M語言:中文 評(píng)分:1.4
  • 標(biāo)簽:
立即下載
Microsoft SQL Server Analysis Services 的這個(gè)最新版本引入了新功能和增強(qiáng)功能。

創(chuàng)建維持測(cè)試集

現(xiàn)在創(chuàng)建挖掘結(jié)構(gòu)時(shí),可以將挖掘結(jié)構(gòu)中的數(shù)據(jù)劃分為定型集和測(cè)試集。分區(qū)的定義與結(jié)構(gòu)存儲(chǔ)在一起,以便可以在基于該結(jié)構(gòu)的任何挖掘模型中重用定型集和測(cè)試集。


數(shù)據(jù)在定型分區(qū)和測(cè)試分區(qū)之間隨機(jī)劃分,但是如果需要重新創(chuàng)建分區(qū),也可以指定用于創(chuàng)建分區(qū)的種子。


可以按照總行數(shù)的百分比或最大行數(shù),或者結(jié)合這兩項(xiàng)要求來指定測(cè)試集的大小。有關(guān)如何使用定型數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的詳細(xì)信息,請(qǐng)參閱將數(shù)據(jù)分區(qū)為定型集和測(cè)試集(Analysis Services - 數(shù)據(jù)挖掘)。


有關(guān) SQL Server 2008 中的所有模型驗(yàn)證功能的詳細(xì)信息,請(qǐng)參閱驗(yàn)證數(shù)據(jù)挖掘模型(Analysis Services – 數(shù)據(jù)挖掘)。


篩選模型事例

現(xiàn)在,可以將篩選器附加到挖掘模型,并在定型和測(cè)試期間應(yīng)用篩選器。對(duì)模型應(yīng)用篩選器,可以控制用于給模型定型的數(shù)據(jù),也更容易評(píng)估出模型對(duì)數(shù)據(jù)子集的準(zhǔn)確情況。


例如,您可能想要知道目標(biāo)郵件模型對(duì)于某種收入水平的客戶的準(zhǔn)確性。您可以在創(chuàng)建提升圖時(shí)對(duì)挖掘模型的 Income 列應(yīng)用篩選器,并僅查看該人口統(tǒng)計(jì)的結(jié)果。


Business Intelligence Development Studio 還提供了新的篩選器編輯器,可幫助您生成適用于事例表和嵌套表的復(fù)雜條件。


有關(guān)如何創(chuàng)建挖掘模型篩選器的詳細(xì)信息,請(qǐng)參閱為挖掘模型創(chuàng)建篩選器(Analysis Services – 數(shù)據(jù)挖掘)。


有關(guān)為挖掘模型測(cè)試篩選數(shù)據(jù)的信息,請(qǐng)參閱模型準(zhǔn)確性圖表工具(Analysis Services - 數(shù)據(jù)挖掘)。


多個(gè)挖掘模型的交叉驗(yàn)證

交叉驗(yàn)證是用于評(píng)估數(shù)據(jù)挖掘模型的準(zhǔn)確性的既定方法。在交叉驗(yàn)證中,可反復(fù)將挖掘結(jié)構(gòu)數(shù)據(jù)分為多個(gè)子集,生成子集的模型,然后衡量每個(gè)分區(qū)的模型的準(zhǔn)確性。通過查看返回的統(tǒng)計(jì)信息,可以確定挖掘模型的可靠程度,并且可以更容易地對(duì)比基于相同結(jié)構(gòu)的模型。


數(shù)據(jù)挖掘設(shè)計(jì)器的“挖掘準(zhǔn)確性圖表”視圖中可以使用交叉驗(yàn)證。您也可以使用 Analysis Services 存儲(chǔ)過程對(duì)挖掘結(jié)構(gòu)分區(qū),測(cè)試多個(gè)挖掘模型,以及生成分析。


若要在 SQL Server 2008 中生成交叉驗(yàn)證報(bào)表,請(qǐng)指定挖掘結(jié)構(gòu)和可預(yù)測(cè)屬性,然后指定用于分割事例數(shù)據(jù)的折疊數(shù)。


Analysis Services 將返回一個(gè)表,報(bào)告各個(gè)分區(qū)的可能性或均方根誤差,以及聚合模型的所有度量值的平均偏差和標(biāo)準(zhǔn)偏差等統(tǒng)計(jì)信息。有關(guān)詳細(xì)信息,請(qǐng)參閱交叉驗(yàn)證(Analysis Services – 數(shù)據(jù)挖掘)。


支持 Office 2007 數(shù)據(jù)挖掘外接程序

使用 SQL Server 2008 Office 2007 數(shù)據(jù)挖掘外接程序時(shí),SQL Server 2008 支持從 Microsoft Excel 創(chuàng)建、管理和使用數(shù)據(jù)挖掘模型。通過增加對(duì)服務(wù)器端定型和測(cè)試分區(qū)、交叉驗(yàn)證和幾個(gè)新的分析工具(例如購(gòu)物籃分析和可打印預(yù)測(cè)計(jì)算器)的支持,此最新版本的受歡迎的免費(fèi)外接程序已得到增強(qiáng)。


還可以使用文檔模型向?qū)лp松為存儲(chǔ)在 SQL Server 2008 實(shí)例中的結(jié)構(gòu)和模型創(chuàng)建文檔。有關(guān)外接程序的詳細(xì)信息,請(qǐng)參閱 Data Mining Add-ins for Office 2007(Office 2007 數(shù)據(jù)挖掘外接程序)。


Microsoft 時(shí)序算法的增強(qiáng)功能

為了改進(jìn)時(shí)序模型中某些預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性,在 Microsoft 時(shí)序算法中增加了一種新的算法。該新算法基于熟知的 ARIMA 算法,它比 Analysis Services 一直使用的 ARTxp 算法可提供更佳的長(zhǎng)期預(yù)測(cè)。(ARTxp 是自動(dòng)回歸樹算法,針對(duì)單個(gè)時(shí)間段預(yù)測(cè)或短期預(yù)測(cè)進(jìn)行了優(yōu)化。)


默認(rèn)情況下,Microsoft 時(shí)序算法的新實(shí)現(xiàn)使用 ARTxp 算法來定型一種版本的模型,使用 ARIMA 算法來定型另一種版本。然后,該算法將權(quán)衡這兩種模型的結(jié)果,以便提供您希望的預(yù)測(cè)特征。如果不想使用此默認(rèn)實(shí)現(xiàn),可以指定 Microsoft 時(shí)序算法僅使用 ARTxp 或 ARIMA 算法。在 SQL Server 2008 Enterprise 中,可以指定算法的自定義加權(quán),以便提供對(duì)可變時(shí)間范圍的最佳預(yù)測(cè)。


現(xiàn)在,Microsoft 時(shí)序算法還可在預(yù)測(cè)期間接受數(shù)據(jù)以啟用新的業(yè)務(wù)方案。例如,可以創(chuàng)建基于平均叉積、區(qū)域聚合或其他某種大數(shù)據(jù)集的收入預(yù)測(cè)模型。然后,將該模型應(yīng)用于顯示各種產(chǎn)品銷售額的時(shí)序。通過應(yīng)用常規(guī)模型,可以利用聚合數(shù)據(jù)的穩(wěn)定性和可用性,并自定義對(duì)各種產(chǎn)品的預(yù)測(cè)。


也可以使用多個(gè)時(shí)序定型數(shù)據(jù),然后對(duì)新數(shù)據(jù)應(yīng)用該模型以預(yù)測(cè)“假設(shè)”情況。


有關(guān)時(shí)序挖掘模型的詳細(xì)信息,請(qǐng)參閱 Microsoft 時(shí)序算法(Analysis Services – 數(shù)據(jù)挖掘)和 PredictTimeSeries (DMX)。


鉆取到結(jié)構(gòu)事例和結(jié)構(gòu)列

在 SQL Server 2008 中,如果對(duì)挖掘結(jié)構(gòu)啟用鉆取,則可以查詢挖掘結(jié)構(gòu)并返回有關(guān)用于定型和測(cè)試的事例的詳細(xì)信息?梢允褂脭(shù)據(jù)挖掘擴(kuò)展插件 (DMX) 創(chuàng)建對(duì)結(jié)構(gòu)的鉆取查詢。


而且,如果對(duì)挖掘模型和相關(guān)的挖掘結(jié)構(gòu)啟用鉆取,則可以創(chuàng)建用于在基礎(chǔ)挖掘結(jié)構(gòu)中檢索數(shù)據(jù)列的查詢。如果想要發(fā)現(xiàn)有關(guān)特定節(jié)點(diǎn)中的事例的詳細(xì)信息,此功能很有用。例如,可以在特定群集中檢索客戶的聯(lián)系信息。


有關(guān)詳細(xì)信息,請(qǐng)參閱針對(duì)挖掘模型和挖掘結(jié)構(gòu)使用鉆。ˋnalysis Services – 數(shù)據(jù)挖掘)。


有關(guān)挖掘結(jié)構(gòu)的 DMX 查詢的示例,請(qǐng)參閱 SELECT FROM <結(jié)構(gòu)>.CASES。


有關(guān)從模型到結(jié)構(gòu)數(shù)據(jù)的鉆取的示例,請(qǐng)參閱 SELECT FROM <模型>.CASES (DMX)。


對(duì)挖掘模型列使用別名

現(xiàn)在,可以為挖掘模型中的列添加別名,以便于理解列內(nèi)容和在 DMX 語句中引用列。


例如,如果生成的挖掘結(jié)構(gòu)包含同一數(shù)據(jù)的連續(xù)版本和離散化版本,則可以為這兩列指定相同的名稱,以便于比較。


有關(guān)如何管理和查看別名的詳細(xì)信息,請(qǐng)參閱設(shè)置挖掘模型的屬性或如何為模型列創(chuàng)建別名。


有關(guān)如何使用 DMX 創(chuàng)建列別名的信息,請(qǐng)參閱 ALTER MINING STRUCTURE (DMX)。


查詢數(shù)據(jù)挖掘架構(gòu)行集

在 SQL Server 2008 中,許多現(xiàn)有 OLE DB 數(shù)據(jù)挖掘架構(gòu)行集已作為可以使用 DMX 語句輕松查詢的一組系統(tǒng)表公開。從而更加易于檢索與模型和結(jié)構(gòu)相關(guān)的元數(shù)據(jù)、從挖掘模型內(nèi)容提取詳細(xì)信息,或者監(jiān)視 Analysis Services 實(shí)例或服務(wù)。


有關(guān)詳細(xì)信息,請(qǐng)參閱查詢數(shù)據(jù)挖掘架構(gòu)行集(Analysis Services - 數(shù)據(jù)挖掘)。


新示例位置

聯(lián)機(jī)叢書不再提供 SQL Server 示例數(shù)據(jù)庫(kù)和示例應(yīng)用程序。這些示例數(shù)據(jù)庫(kù)和示例應(yīng)用程序現(xiàn)在位于 SQL Server Samples(SQL Server 示例)網(wǎng)站上。該網(wǎng)站便于用戶查找這些示例,還提供了與 Microsoft SQL Server 和商業(yè)智能相關(guān)的其他新示例。在 SQL Server 示例網(wǎng)站上,您可以執(zhí)行下列操作:


-瀏覽由開發(fā)人員、用戶和 Microsoft 最有價(jià)值專家 (MVP) 社區(qū)提供的示例。


-下載示例數(shù)據(jù)庫(kù)和代碼項(xiàng)目。


-查看或參與討論區(qū),您可以在討論區(qū)報(bào)告和詢問與各技術(shù)領(lǐng)域的示例相關(guān)的問題。


與 SQL Server 2005 Analysis Services 并行安裝

SQL Server 2008 Analysis Services 現(xiàn)在可與 SQL Server 2005 Analysis Services (SSAS) 并行安裝。有關(guān)詳細(xì)信息,請(qǐng)參閱使用 SQL Server 的多個(gè)版本和實(shí)例。


對(duì)于影響 Analysis Services 的重要的并行安裝問題,請(qǐng)參閱本版本所附的自述文件。


備份和還原 Analysis Services 數(shù)據(jù)庫(kù)

備份和還原 Analysis Services 數(shù)據(jù)庫(kù)的功能已得到增強(qiáng)。減少了對(duì)數(shù)據(jù)庫(kù)大小的限制,備份和還原操作需要的時(shí)間已大大降低。


有關(guān)詳細(xì)信息,請(qǐng)參閱新增功能(Analysis Services - 多維數(shù)據(jù)庫(kù))。


Analysis Services 的其他增強(qiáng)功能

如果使用 Analysis Services 來創(chuàng)建也用于數(shù)據(jù)挖掘的 OLAP 多維數(shù)據(jù)集,您可能會(huì)發(fā)現(xiàn)可以更容易地設(shè)計(jì)維度及其相關(guān)的層次結(jié)構(gòu)和屬性。維度設(shè)計(jì)器中提供了新的屬性關(guān)系設(shè)計(jì)器,可幫助您設(shè)計(jì)屬性關(guān)系,并確保屬性關(guān)系遵循最佳實(shí)踐。
    sql server
    (11)sql server
    西西軟件園提供免費(fèi)的下載,是很多小型企業(yè)公司使用到的數(shù)據(jù)庫(kù)軟件,是一個(gè)功能強(qiáng)大且可靠的數(shù)據(jù)管理系統(tǒng),它功能豐富,能保護(hù)數(shù)據(jù),并且可改善嵌入式應(yīng)用程序客戶端輕型應(yīng)用程序以及本地?cái)?shù)據(jù)存儲(chǔ)區(qū)的性能。具有易于部署以及可以快速設(shè)計(jì)原型的特點(diǎn),您可以無償獲取并可以隨應(yīng)用程序免費(fèi)再分發(fā)。它設(shè)計(jì)成可與其他服務(wù)器基礎(chǔ)結(jié)構(gòu)資產(chǎn)無縫集成。...更多>>
    • SQL Server 2008 SP2精簡(jiǎn)版免費(fèi)版

      05-15 / 91.2M

      推薦理由:SQL Server 2008 Express 是 SQL Server 的免費(fèi)版本,是學(xué)習(xí)和構(gòu)建桌面及小型服務(wù)器應(yīng)用程序的理想選擇,且
    • Microsoft SQL Server 2000 Enterp

      05-15 / 358.4M

      推薦理由:SQL Server 是一個(gè)關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)它最初是由Microsoft Sybase 和Ashton-Tate三家公司共同開發(fā)的于1988
    • sqlserver2005驅(qū)動(dòng)包

      11-14 / 3.5M

      推薦理由:這是連接sql server2005所必須用到的驅(qū)動(dòng)包,找個(gè)能用的sqlserver2005 jdbc 驅(qū)動(dòng)真不容易啊,這是經(jīng)過我測(cè)試
    • Microsoft SQL Server 2005 Expres

      06-02 / 40.0M

      推薦理由:SQL Server Express 是一種強(qiáng)大而可靠的數(shù)據(jù)管理產(chǎn)品,可以為嵌入的應(yīng)用程序客戶端、輕型 Web 應(yīng)用程序以及
    • Microsoft SQL Server 2008 Native

      09-30 / 10.5M

      推薦理由:Microsoft SQL Server 2008 Native Client (SQL Server Native Client) 是一個(gè)同時(shí)包含 SQL OLE DB 訪問接口
    • SQL Server數(shù)據(jù)庫(kù)管理及開發(fā)工具(N

      05-16 / 42.7M

      推薦理由:NavicatforSQLServer是一套專為MicrosoftSQLServer設(shè)計(jì)的強(qiáng)大數(shù)據(jù)庫(kù)管理及開發(fā)工具。它可以用于SQLServer20

    相關(guān)評(píng)論

    閱讀本文后您有什么感想? 已有人給出評(píng)價(jià)!

    • 8 喜歡喜歡
    • 3 頂
    • 1 難過難過
    • 5 囧
    • 3 圍觀圍觀
    • 2 無聊無聊

    熱門評(píng)論

    最新評(píng)論

    發(fā)表評(píng)論 查看所有評(píng)論(0)

    昵稱:
    表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
    字?jǐn)?shù): 0/500 (您的評(píng)論需要經(jīng)過審核才能顯示)