Teradata Package for Python Function Reference | 20.00 - __init__ - Teradata Package for Python - Look here for syntax, methods and examples for the functions included in the Teradata Package for Python.

Teradata® Package for Python Function Reference - 20.00

Deployment
VantageCloud
VantageCore
Edition
Enterprise
IntelliFlex
VMware
Product
Teradata Package for Python
Release Number
20.00
Published
March 2024
Language
English (United States)
Last Update
2024-04-10
dita:id
TeradataPython_FxRef_Enterprise_2000
Product Category
Teradata Vantage
teradataml.automl.__init__.AutoClassifier.__init__ = __init__(self, include=None, exclude=None, verbose=0, max_runtime_secs=None, stopping_metric=None, stopping_tolerance=None, custom_config_file=None)
DESCRIPTION:
    AutoClassifier is a special purpose AutoML feature to run classification specific tasks.
    
PARAMETERS:  
    include:
        Optional Argument.
        Specifies the model algorithms to be used for model training phase.
        By default, all 5 models are used for training for regression and binary
        classification problem, while only 3 models are used for multi-class.
        Permitted Values: "glm", "svm", "knn", "decision_forest", "xgboost"
        Types: str OR list of str  
    
    exclude:
        Optional Argument.
        Specifies the model algorithms to be excluded from model training phase.
        No model is excluded by default. 
        Permitted Values: "glm", "svm", "knn", "decision_forest", "xgboost"
        Types: str OR list of str
            
    verbose:
        Optional Argument.
        Specifies the detailed execution steps based on verbose level.
        Default Value: 0
        Permitted Values: 
            * 0: prints the progress bar and leaderboard
            * 1: prints the execution steps of AutoML.
            * 2: prints the intermediate data between the execution of each step of AutoML.
        Types: int
        
    max_runtime_secs:
        Optional Arugment.
        Specifies the time limit in seconds for model training.
        Types: int
        
    stopping_metric:
        Required, when "stopping_tolerance" is set, otherwise optional.
        Specifies the stopping mertics for stopping tolerance in model training.
        Types: str
 
    stopping_tolerance:
        Required, when "stopping_metric" is set, otherwise optional.
        Specifies the stopping tolerance for stopping metrics in model training.
        Permitted Values: 
            * For task_type "Regression": "R2", "MAE", "MSE", "MSLE", 
                                          "RMSE", "RMSLE"
            * For task_type "Classification": 'MICRO-F1','MACRO-F1',
                                              'MICRO-RECALL','MACRO-RECALL',
                                              'MICRO-PRECISION', 'MACRO-PRECISION',
                                              'WEIGHTED-PRECISION','WEIGHTED-RECALL',
                                              'WEIGHTED-F1', 'ACCURACY'
        Types: float
        
    custom_config_file:
        Optional Argument.
        Specifies the path of json file in case of custom run.
        Types: str
        
RETURNS:
    Instance of AutoClassifier.
 
RAISES:
    TeradataMlException, TypeError, ValueError
    
EXAMPLES:    
    # Notes:
    #     1. Get the connection to Vantage to execute the function.
    #     2. One must import the required functions mentioned in
    #        the example from teradataml.
    #     3. Function will raise error if not supported on the Vantage
    #        user is connected to.
 
    # Load the example data.
    >>> load_example_data("teradataml", ["titanic", "iris_input"])
    >>> load_example_data("GLMPredict", ["admissions_test", "admissions_train"])
    
    # Create teradataml DataFrame object.
    >>> admissions_train = DataFrame.from_table("admissions_train")
    >>> titanic = DataFrame.from_table("titanic")
    >>> iris_input = DataFrame.from_table("iris_input")
    >>> admissions_test = DataFrame.from_table("admissions_test")
    
    # Example 1 : Run AutoClassifier for binary classification problem
    # Scenario : Predict whether a student will be admitted to a university
    #            based on different factors. Run AutoML to get the best performing model
    #            out of available models.
    
    # Create instance of AutoClassifier..
    >>> automl_obj = AutoClassifier()
 
    # Fit the data.
    >>> automl_obj.fit(admissions_train, "admitted")
 
    # Predict using best performing model.
    >>> prediction = automl_obj.predict()
    >>> prediction
    
    # Run predict for new test data with best performing model.
    >>> prediction = automl_obj.predict(admissions_test)
    >>> prediction
    
    # Run predict for new test data with second best performing model.
    >>> prediction = automl_obj.predict(admissions_test, rank=2)
    >>> prediction
 
    # Display leaderboard.
    >>> automl_obj.leaderboard()
 
    # Display best performing model.
    >>> automl_obj.leader()
 
    # Example 2 : Run AutoClassifier for binary classification.
    # Scenario : Predict whether passenger aboard the RMS Titanic survived
    #            or not based on differect factors. Run AutoML to get the 
    #            best performing model out of available models. Use custom
    #            configuration file to customize different processes of
    #            AutoML Run. 
    
    # Generate custom configuration file.
    >>> AutoClassifier.generate_custom_config("custom_titanic")
    
    # Create instance of AutoClassifier.
    >>> automl_obj = AutoClassifier(verbose=2, 
    >>>                             custom_config_file="custom_titanic.json")
    # Fit the data.
    >>> automl_obj.fit(titanic, titanic.survived)
 
    # Run predict with best performing model.
    >>> prediction = automl_obj.predict()
    >>> prediction
 
    # Run predict with second best performing model.
    >>> prediction = automl_obj.predict(rank=2)
    >>> prediction
 
    # Display leaderboard.
    >>> automl_obj.leaderboard()
 
    # Display best performing model.
    >>> automl_obj.leader()
 
    # Example 3 : Run AutoClassifier for multiclass classification problem.
    # Scenario : Predict the species of iris flower based on different factors.
    #            Run AutoML to get the best performing model out of available 
    #            models. Use custom configuration file to customize different 
    #            processes of AutoML Run.
    
    # Generate custom configuration file.
    >>> AutoClassifier.generate_custom_config("custom_iris")
    
    # Create instance of AutoClassifier.
    >>> automl_obj = AutoClassifier(verbose=1, 
    >>>                             custom_config_file="custom_iris.json")
    # Fit the data.
    >>> automl_obj.fit(iris_input, "species")
 
    # Predict using best performing model.
    >>> prediction = automl_obj.predict()
    >>> prediction
 
    # Display leaderboard.
    >>> automl_obj.leaderboard()
 
    # Display best performing model.
    >>> automl_obj.leader()
 
    # Example 4 : Run AutoClassifier for classification problem with stopping metric and tolerance.
    # Scenario : Predict whether passenger aboard the RMS Titanic survived
    #            or not based on differect factors. Use custom configuration 
    #            file to customize different processes of AutoML Run. Define
    #            performance threshold to acquire for the available models, and 
    #            terminate training upon meeting the stipulated performance criteria.
    
    # Generate custom configuration file.
    >>> AutoClassifier.generate_custom_config("custom_titanic")
 
    # Create instance of AutoClassifier.
    >>> automl_obj = AutoClassifier(verbose=2, 
    >>>                     exclude="xgboost",
    >>>                     stopping_metric="MICRO-F1",
    >>>                     stopping_tolerance=0.7,
    >>>                     custom_config_file="custom_titanic.json")
    # Fit the data.
    >>> automl_obj.fit(titanic, titanic.survived)
 
    # Run predict with best performing model.
    >>> prediction = automl_obj.predict()
    >>> prediction
 
    # Display leaderboard.
    >>> automl_obj.leaderboard()
 
    # Example 5 : Run AutoClassifier for classification problem with maximum runtime.
    # Scenario : Predict the species of iris flower based on different factors.
    #            Run AutoML to get the best performing model in specified time.
 
    # Create instance of AutoClassifier.
    >>> automl_obj = AutoClassifier(verbose=2, 
    >>>                     exclude="xgboost",
    >>>                     max_runtime_secs=500)
    # Fit the data.
    >>> automl_obj.fit(iris_input, iris_input.species)
 
    # Run predict with best performing model.
    >>> prediction = automl_obj.predict()
    >>> prediction
 
    # Run predict with second best performing model.
    >>> prediction = automl_obj.predict(rank=2)
    >>> prediction
 
    # Display leaderboard.
    >>> automl_obj.leaderboard()
 
    # Display best performing model.
    >>> automl_obj.leader()